11/06/2015

我為什麼教資料探勘

學校推動三化課程,縮減必修課程的總學分數,改成模組化讓學生選擇,以便學生發展自己的興趣和專長原本下學期的必修課作業研究因此變成選修,所以勢必得開發新課。

資管系的課程可以分成三大類,分別是數學、管理、和資訊。教數學的經驗不太美好,下學期我已經教生管,所以想教資訊類的課程。說實在的,資訊非我專長,所以選擇有限。

原本想教網頁設計。我教 Java 時,出了一個身分證檢驗的作業。在不懂 JavaScript 和 HTML 的情況下,想把它改寫成網頁;我英文閱讀沒有問題,分幾天除錯 (debug),總共花了十個小時才完成。一般學生學不會的原因便是太容易放棄,看到一個錯誤,無法靜下心花一個小時來處理之;或者看懂英文的網路資料,以幫助解決問題。所以需要寫程式的課也不容易教。

我一直都有吸收相關的新知,例如閱讀哈佛商業評論 (Harvard Business Review)、商業周刊、相關書籍、專業研究論文等等發現資料的處理和分析非常有潛力,業界的人力需求很大,便著手了解資料探勘的相關問題。一般而言,需要領域知識以了解產業的問題,接下來是做資料的數學分析,例如統計和作業研究,最後使用程式 (R) 實現之。這三方面我都有一點點的基礎,所以才決定開這方面的課程。

但是,準備課程的過程中還是耗費大量的心力,單是找到滿足上述三條件的課本就花了好一陣子。針對教科書中描述不清的地方,依慣例使用其他的資料以補其不足,所以花了整整一個寒假和一個學期才完成相關內容該班的教學評量給我 4.58 分,總算有一門課高於全校平均。

去年教的時候,發現有一些可以改進的空間,例如作業的內容、期末報告實施的方法等等,準備在下學期的課程中改進之。下學期也將在研究所開類似的課程,勢必得增加一些新的內容,所以現在也積極地研究一些有趣的問題,例如線上廣告和深度學習 (deep learning)。也發現了機率統計、線性代數和最佳化 (optimization) 在許多問題的應用,再一次印證基礎訓練的重要性,可以幫助一個人的終身學習;如果以後重新教這些課程,將增加這些有趣的應用。

這是當大學老師迷人之處,可以做自己喜歡的事情,也有選擇的自由。透過圖書的推薦和相關的論文期刊,讓我們可以在不需要經費的情況下,發展新的專長與能力。

有一回,準備本文探勘 (text mining) 的上課資料時,面臨到編碼的問題,導致無法執行。我用土法煉鋼的方法避免了該困難;但是,近二千筆資料中,執行結果還是和課本差一筆資料。就將該問題放在系上老師的臉書專頁,不到幾分鐘,林青峰老師便告知應該使用哪種編碼,便順利解決該問題。這也是大學工作迷人之處,有許多具有高度專業知識的同事,可以尋求他們的幫忙。

沒有留言:

張貼留言