7/09/2013

當你使用 Google 搜尋網頁時,結果是如何排序的?

解聯立方程式 A x = x 

當你搜尋網頁時,為什麼有的在前,有的在後?Google 創辦人的點子如下 (註 1),如果越多的網頁連結到一個網頁,代表該網頁越重要,將出現在越前面的位置。 

以我的線性代數講義第 52 頁的例子說明,當瀏覽者瀏覽網頁 A 時,因為連結到網頁 B 和 C,瀏覽者可能隨機瀏覽 B 或 C,所以其機率都是 1 / 2。當瀏覽者瀏覽網頁 B 時,因為只連結到網頁 C,瀏覽者只可能瀏覽網頁 C,所以其機率是 1。寫下所有的方程式就是 A x = x,越大的值就出現在搜尋結果的越上面。 

如果使用數學的術語說明,該演算法 (命名為 PageRank) 是使用隨機過程 (stochastic process) 的馬可夫鏈 (Markov chain) 來描述隨意搜索的行為,而 PageRank 為特徵值 1 的特徵向量。

進一步的資料可以參考 Anand Rajaraman 和 Jeff Ullman 所寫的書 Mining of Massive Datasets 第五章 

(註 1) L. Page, S. Brin, R. Motwani, and T. Winograd, The PageRank Citation Ranking: Bringing Order to the Web, Stanford University, 1999. 

沒有留言:

張貼留言