8/22/2014

奇異值分解 (singular value decomposition) 的應用

資訊檢索
Michael W. Berry, Susan T. Dumais, and Gavin W. O’Brien, Using Linear Algebra for Intelligent Information Retrieval, SIAM Review, 37(4), 1995, p. 573–595.
 推薦系統
Jure Leskovec, Anand Rajaraman, and Jeff Ullman, Mining of Massive Datasets, Chapter 11 Dimensionality Reduction.

8/12/2014

新手機出現和舊機變慢

Laura Trucco 利用 Google Trends 分析 Apple 和 Samsung 新手機出現後,查詢舊機速度變慢的次數,有了如下有趣的結果




文章 (Sendhil Mullainathan, Hold the Phone: A Big-Data Conundrum, NYTimes, JULY 26, 2014) 提供許多有趣的觀察

8/06/2014

大學教了沒 (Our Underachieving Colleges)

Derek Bok, Our Underachieving Colleges: A Candid Look at How Much Students Learn and Why They Should Be Learning More, Princeton University Press, 2005.
張善楠譯,大學教了沒?:哈佛校長提出的 8 門課,天下文化,2008

不論是歐美亞的評比,哈佛大學 (Harvard University) 的排名總是在前幾名,所以其前校長的書值得參考。共 50 頁的參考文獻則提供進一步的資訊。

8/04/2014

計算螺絲的體積

台灣是螺絲生產大國,接單時必須根據螺絲形狀計算其體積和成本 (註 1)。如果報價太高,可能接不到單;如果報價太低,接單生產的利潤低、甚至虧錢。

許多老闆沒學過微積分,常常根據經驗來估計成本,所以事後才能得知新產品的利潤。朋友使用微積分 (註 2),可以事前得知新螺絲的體積;但是,一套數萬元的軟體常常被廠商殺價,所以建議朋友的業務向廠商報告時,第一張投影片採用下表來說明該軟體的價值


表的橫軸代表訂購量,縱軸代表體積計算的誤差量,空白處代表成本的誤差量。如果訂購量是 1 千萬,誤差 1%,誤差成本是 1 萬元,接單數次該軟體就回本 (註 3)。

(註 1) 根據體積和生產螺絲材料的成本,可以得知單一螺絲的物料直接成本。
(註 2) 使用公式或數值積分計算之。關於數值積分,講義  11-16 頁計算面積誤差,計算體積 (講義  15-2 頁) 時也有類似的公式,只要取樣點 m 和 n 夠大,誤差就會很小。
(註 3) 假設誤差 1% 的單位成本是 0.1 元。根據廠商實際的經驗,誤差 5% 或更高也發生過。

8/02/2014

The Signal and the Noise

Nate Silver, The Signal and the Noise: Why So Many Predictions Fail — but Some Don't,
Penguin Press, 2012
蘇子堯譯,精準預測:如何從巨量雜訊中,看出重要的訊息?,三采,2013

前 7 章說明預測的困難,包括較複雜的 (第四到七章) 動態系統 (dynamic systems)
在本書中,席佛針對政治選情、球賽結果與球員價值的評估、金融風暴、氣象、地震、撲克賭局、西洋棋賽、股市投資等跨領域的預測難題,做了精闢的個案分析。