Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
独自の検索エンジンを構築するのではなく、このようなページ ランク アルゴリズムの開発に基づいて GP を作成することに非常に興味があります。
検索エンジンなしでアルゴリズムをテストする方法はありますか?
ほとんどの非 Web データセットは PageRank の観点からはそれほど興味深いものではないため、これを Web に対してテストすることに関心があると仮定します。
commoncrawl.org には、AWS で比較的安価に処理できる Web クロールがあります。それは途中で多くの仕事を取り除くかもしれません。