有色的眼鏡
要應用資料分析常遇到的一道難題,就是不知道該量測些什麼。
我有個朋友曾在美國留學過,回台灣後,發現自己對於教學很有熱忱,就投入補習教育。一回,我們閒聊時,友人提到,他對於數學教學有發展出一套獨特的方法,可以大幅提高教學效率。
我一聽到『教學效率』一詞,就忍不住問了他
提高教學效率是指,可以很快地教會一個人一些頗為抽象的數學概念,比方說,柯西不等式如果把向量想象成無限長甚至變成了函數,就可以變成積分型式的柯西不等式;又或是說,機率加入了微積分的思考之後,就可以有機率密度函數這樣子的概念…
友人回我
呃,是中學數學…
友人後來解釋
很多人的數學會學不好,是因為數學的知識有依賴關系,一旦某個關鍵環節的知識沒有學好,後面的知識因為都依賴該關鍵環節所以會全部學不好。也因此,解決的方法是,要先回溯去找出該學員沒有學好的環節,先把之前鬆動的基礎修好,才能再繼續往下教。沒有先回溯去找出之前的鬆動基礎的教法,都是浪費時間而已。
而我的數學教法的核心,在於應用『有向圖』去做數學能力的診斷,先做完診斷,再做治療。
我聽完友人的說明,就憑自己對國小數學的一些知識依賴關系,順手畫了一個簡易的有向圖。友人看了表示,『沒錯,就是類似的概念。』
理論模型的重要性
觀察友人的數學教學法,我覺得他在這件事情上,巧妙地應用了兩種想法:理論模型與資料分析。一方面,他建立了一個模型,該模型可以解釋為什麼有些人有數學的學習障礙。另一方面,他透過採集資料來做出診斷。根據他的說法,根據採集到的資料搭配他建立的理論模型去判斷學生的學習障礙,可以很快就定位問題,讓教學的效率大幅提昇。
然而,很多時候,如果要應用資料分析處理不熟悉的領域時,資料分析人員遇到的第一道難題,就是缺乏理論模型,也因此根本不知道要從哪邊開始採集資料。實務上,缺乏理論模型時,資料分析人員還是會想方設法,儘可能地去收集資料。資料採集之後就利用探索式資料分析 (exploratory data analysis),去尋找哪些資料與要最佳化的結果相關。然而,此處有一個盲點,只靠常識或想象力去收集到的資料,往往總是落在理論模型的外部,而不會是在落在模型之內的資料點。也因此,儘管用了資料分析的方法論,還是只找得到相關 (correlation) 、找不到因果 (causation) 。
愛因斯坦曾說過:「原則上由觀察到的數值來建立一個理論是不對的。實際上往往相反,反而是你用的理論決定你能觀察到甚麼。」也因此,如果應用資料分析去解決問題的成效不佳,除了檢查資料分析的流程是否正確之外,也很有可能,一切的關鍵點在於還沒有找到一個合適的理論模型。


