URLを受け取り、そのページの読み取り可能なコンテンツを返すWeb APIはありますか?または、これを実行できるjavascriptライブラリはありますか?
node.jsまたはサーバー側アプリをインストールすることはできません。
URLを受け取り、そのページの読み取り可能なコンテンツを返すWeb APIはありますか?または、これを実行できるjavascriptライブラリはありますか?
node.jsまたはサーバー側アプリをインストールすることはできません。
それは実際には本当に難しい問題です。このような質問は通常、サイドバーや同様の「ノイズ」要素を除外することを意味します。これは、機械学習コンピュータドメイン内のさまざまなトレーニングセットで解決されることが多く、開発は簡単ではありません。
そうは言っても、以下を見てください。
これは、問題のあるドメインをより適切に検索できるように、スペースについて十分に学習するのに役立ちます。
Mashape(http://www.mashape.com/)でいくつかの関連サービスを見つけることができると思います。
「テキスト」を検索します。このように:https ://www.mashape.com/search?query = text
そこにはいくつかのNLP/分析プロバイダーがあり、それらのほとんどはフリーミアムです。
OTOH、ボイラーパイプというプロジェクトもあります。以下のURLで品質をテストできます。