1/20/2019

Python 機器學習

幾年前教大四資料探勘使用 R

受到 AlphaGo 的影響注意到 TensorFlow 強大的功能所以去年研究所的機器學習改用 Python任教的過程中發現學生的學習曲線較高所以今年改用 Keras

機器學習分成問題數學和程式有的課程只教一個面向。在新版的資料探勘課程中依然採用三者合一的教學上課影片和上課資料 (作業檔) 在此

如何在深淺度之間取得平衡花了些心思,參考的資料包括一堆教科書、線上課程、論文、新聞和產業工作。

以問題應用而言在適當的章節說明例如 4-4 節 Zara 降價定價5-6 節摩根大通多資產趨勢跟踪策略

就數學而言在適當的時機複習微積分線性代數統計學7-17 反向傳播的推導

程式碼也是挺有趣的例如 4-3 節線性迴歸方程式,課本只教 sklearn。想說教一下顯著性,所以用statsmodels.api,沒想到兩種算法竟然出現不同的答案。只好試了第三種 (公式解), 答案和第二種一樣。 之前,不知道花了多少小時,就是找不到原因。這幾天準備要錄影上傳,想說再試一下,再仔細地看了一下官方的規格書,才發現 sklearn 預設的正規化很奇特 (除 l2 norm),和statsmodels.api 的 z 值正規化 (除標準差) 不同。 經過修正後,答案總算一樣了。第五章的隨機梯度演算法 (stochastic gradient algorithm)利用 Python 預設值單變數線性迴歸竟然發散

其實,在這之前已經上過幾次一改再改大概數百小時所以一定要定稿告一個段落以便能從事其他事情

這算是新年新希望

沒有留言:

張貼留言