當你搜尋網頁時,為什麼有的在前,有的在後?Google 創辦人的點子如下 (註 1),如果越多的網頁連結到一個網頁,代表該網頁越重要,將出現在越前面的位置。
以我的線性代數講義第 52 頁的例子說明,當瀏覽者瀏覽網頁 A 時,因為連結到網頁 B 和 C,瀏覽者可能隨機瀏覽 B 或 C,所以其機率都是 1 / 2。當瀏覽者瀏覽網頁 B 時,因為只連結到網頁 C,瀏覽者只可能瀏覽網頁 C,所以其機率是 1。寫下所有的方程式就是 A x = x,越大的值就出現在搜尋結果的越上面。
如果使用數學的術語說明,該演算法 (命名為 PageRank) 是使用隨機過程 (stochastic process) 的馬可夫鏈 (Markov chain) 來描述隨意搜索的行為,而 PageRank 為特徵值 1 的特徵向量。
進一步的資料可以參考 Anand Rajaraman 和 Jeff Ullman 所寫的書 Mining of Massive Datasets 的第五章
(註 1) L. Page, S.
沒有留言:
張貼留言