PageRank 解説

Mining of Massive Datasetsというのを輪読していて、PageRankに関する部分のスライドを折角作ったのでslidshareに置いておきました。


最後のRでのPageRankの実装について補足をしておくと、Rで固有値を求める場合行列の全ての固有値固有ベクトルを求めているので全然フェアではないです。反復法が断トツで早いのには変わりはないですが。
こうして実装してみると非常に簡単ですが実際には行列の次元が100万~10億以上になるので計算には相当な工夫が必要だと思います(次の5.2章が実装についての話)。
あとPageRankの特許はスタンフォード大が保持していてgoogleに独占でライセンスしているらしいのでアメリカで勝手に実装すると本当はアウトなんですかね。googleが訴訟したことは一度もないらしいですが。まぁ、そもそももうgoogleはこのPageRankをそのまま使ってないでしょうけど。