-1

ubuntuでnutchとsolrを使用しています。php を使用してデータベースにクエリを実行するか、他の方法を使用して、特定の URL またはドメインに移動するインデックス付きページからのリンクの配列を返したいと考えています。私を正しい方向に向けてください。

このチュートリアルを使用して、スパイダーをセットアップしましたhttp://nlp.solutions.asia/?p=180

また、php 言語オプション、または php curl またはコマンド ライン インターフェイスを介した Nutch または sorl アプリケーションとの API インターフェイスが優先されることにも注意してください。ありがとう

4

1 に答える 1

0

データベース内にインリンクが保存されていることに気付きました。次のクエリを実行すると、各行からインリンクを解析した後、creativecommons.org ドメインへのインデックス付きインバウンドリンクが取得されます。

SELECT * FROM webpage WHERE inlinks LIKE '%creativecommons.org%'

于 2013-03-17T04:44:40.173 に答える