問題タブ [boilerpipe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1671 参照

java - ボイラーパイプ Web API

自分のバージョンのボイラーパイプ Web API (http://code.google.com/p/boilerpipe/) をホストしたいと考えています。アプリスポット サイトはhttp://boilerpipe-web.appspot.com/です。

私はそれをセルフホストしたいと思います。Boilerpipe JAR を使用して Web ページを作成する方法を教えてもらえますか?

0 投票する
1 に答える
1213 参照

javascript - ボイラーパイプに引っかかった

このユーティリティにはかなり興奮していますが、実装に関していくつかの問題に直面しています。インストールしましたが、サーバーで HTML ファイルを実行しても結果が得られませんでした。URL コードの構文エラー。

編集 =====> このコードは機能しているようです。

?>

0 投票する
2 に答える
1986 参照

java - ボイラーパイプの取り付けに問題があります

取り付けたのはこれで3回目です。私はそれを Windows で動作させ、数日前までは Linux で動作させていました。できることはすべてやりましたが、この Java プログラムの実行方法がわかりません。

ソース コードは、lib、src、いくつかの jar、およびクラスパスとプロジェクト ファイルを含むフォルダーです。クラスパス ファイルは、classpathentry=src/main および path=lib, path=src のようないくつかの宣言を行います。

これらはすべて理にかなっています。「src」内に「main」フォルダがあります。

私が実行しようとしている小さなファイルは、

import de.l3s.boilerpipe.demo

「Oneliner.java」を実行しようとしています。コンパイルできません。

そのクラスファイルがどこにあっても実行できません。その結果、noclassdeffound が発生します。メイン、src、ルート、デモなど、どこでも実行しました。推奨されるさまざまな Java コマンド ライン スイッチを使用して実行し、さまざまなディレクトリでコンパイルしてみました。おそらく、私がまだ経験していないファイルを「検索」することができます。この Java 環境の頑固さには恐ろしいものがあります。そして、私にとって非常に屈辱的です。

0 投票する
1 に答える
3468 参照

java - ローカルhtmlファイルでボイラーパイプを使用する方法は?

ローカルディスクにhtmlファイルがあり、BoilerPipeを使用してそこからテキストを抽出したいと思います。

ExtractorBaseクラスの「getText」メソッドはリーダーを受け入れるので、次のように書きました。

しかし、この2行目のコードを指すエラーが発生します。

どんな手掛かり?どうも!

編集:エラーメッセージ全体は次のとおりです:

0 投票する
4 に答える
2267 参照

c# - .net用のボイラーパイプポートはありますか?

ボイラーパイプライブラリの.netポートを知っている人はいますか?

0 投票する
5 に答える
4197 参照

python - Pythonでボイラーパイプをインポートする際の問題

RSSフィードからニュース記事を取得するPythonを使用してアプリケーションを構築しています。私のプロジェクトの一環として、記事が表示される html ページから記事のコンテンツだけを抽出するために、ボイラーパイプを使用することにしました。

ボイラーパイプはもともと Java 用に作成されましたが、Python にも移植されています。ここの github でそのページを見ることができます: https://github.com/misja/python-boilerpipe

問題は、次を使用してインポートしようとすると例外が発生することです。

私が得るエラーは次のとおりです。

この問題の原因は何ですか?どうすれば修正できますか?

0 投票する
2 に答える
1929 参照

java - Boilerpipeを使用してWebページからニュースコンテンツを抽出するにはどうすればよいですか?

Webページからメインのニュースコンテンツを抽出する必要があります。インターネットで検索したところ、その目的で無料で利用できるBoilerpipeという名前のAPIが見つかりました。http://boilerpipe-web.appspot.com/しかし、で実装を見つけることができません。 Boilerpipeを利用するJava。JavaでBoilerpipeを使用してニュースコンテンツを抽出する方法や、Boilerpipeを使用してニュースWebページからコンテンツを抽出するJavaの実装へのリンクを教えてもらえますか?

0 投票する
1 に答える
645 参照

java - Windows にボイラーパイプをインストールするには?

Windows で Netbeans を使用してボイラーパイプを使用する方法を誰か教えてもらえますか? 最初にJavaコードを教えていただければ幸いです。

0 投票する
1 に答える
453 参照

java - インライン CSS で HTML 記事テキストを抽出する

クロールされた HTML Web ページからテキストを抽出したいと考えています。私はまさにそれを行うために、優れたオープン ソースのBoilerpipeライブラリを使用しています。ただし、Boilerpipe を使用すると、生のテキストしか取得できません。生のテキストに加えて、すべての css スタイリング情報をインライン化して、元のソースの書式設定情報を含むテキストをキャプチャする必要があります。

Boilerpipe または他の Java ライブラリ、できればオープン ソースでこれを行う方法はありますか?

0 投票する
1 に答える
2125 参照

web-scraping - ボイラーパイプ記事エクストラクタからドキュメント統計を実行して取得する方法は?

ボイラーパイプの ArticleExtractor クラスの使用について、私がよく理解していないことがあります。とはいえ、私はJavaも初めてなので、おそらくこの環境に関する私の基本的な知識に誤りがあります。

とにかく、ボイラーパイプを使用して、収集した生の HTML ソースから主要な記事を抽出しようとしています。HTML ソース テキストは、Web ページの生の HTML コンテンツを持つ java.lang.String 変数 (htmlstr と呼びましょう) 変数に格納されます。

次のように、ボイラーパイプを実行して、抽出されたテキストを出力ウィンドウに出力する方法を知っています。

ただし、最初に ArticleExtractor クラスのインスタンスをインスタンス化し、それを「TextDocument」入力データ型で呼び出すことによって BP を実行する方法がわかりません。TextDocument データ型自体は、何らかの形で BP の「TextBlock」データ型から構築されており、おそらくこれを正しく行っていません...

htmlstr 文字列変数から TextDocument 型変数を作成する適切な方法は何ですか?

したがって、私の問題は、上記の例のように ArticleExtractor getText メソッドを呼び出す以外に、BP の Article Extractor クラスの処理メソッドを使用することです。つまり、使い方がわからない

方法。

この ArticleExtractor プロセス メソッドを実行して、BP の

方法?統計を使用して、フィルタリングがどの程度良好であると推定されたかを判断したいと思います。

誰かが私を助けることができるコード例はありますか?