1

URLを受け取り、そのページの読み取り可能なコンテンツを返すWeb APIはありますか?または、これを実行できるjavascriptライブラリはありますか?

node.jsまたはサーバー側アプリをインストールすることはできません。

4

2 に答える 2

1

それは実際には本当に難しい問題です。このような質問は通常、サイドバーや同様の「ノイズ」要素を除外することを意味します。これは、機械学習コンピュータドメイン内のさまざまなトレーニングセットで解決されることが多く、開発は簡単ではありません。

そうは言っても、以下を見てください。

これは、問題のあるドメインをより適切に検索できるように、スペースについて十分に学習するのに役立ちます。

于 2013-01-01T13:08:28.937 に答える
0

Mashape(http://www.mashape.com/)でいくつかの関連サービスを見つけることができると思います。

「テキスト」を検索します。このように:https ://www.mashape.com/search?query = text

そこにはいくつかのNLP/分析プロバイダーがあり、それらのほとんどはフリーミアムです。

OTOH、ボイラーパイプというプロジェクトもあります。以下のURLで品質をテストできます。

http://boilerpipe-web.appspot.com/

于 2013-01-01T13:15:12.550 に答える