RSSフィードからニュース記事を取得するPythonを使用してアプリケーションを構築しています。私のプロジェクトの一環として、記事が表示される html ページから記事のコンテンツだけを抽出するために、ボイラーパイプを使用することにしました。
ボイラーパイプはもともと Java 用に作成されましたが、Python にも移植されています。ここの github でそのページを見ることができます: https://github.com/misja/python-boilerpipe
問題は、次を使用してインポートしようとすると例外が発生することです。
from boilerpipe.extract import Extractor
私が得るエラーは次のとおりです。
Traceback (most recent call last):
File "", line 1, in
File "build\bdist.win32\egg\boilerpipe\extract__init__.py", line 12, in
File "C:\Python26\lib\site-packages\jpype_jclass.py", line 54, in JClass
raise _RUNTIMEEXCEPTION.PYEXC("Class %s not found" % name)
jpype._jexception.ExceptionPyRaisable: java.lang.Exception: Class
de.l3s.boilerpipe.sax.HTMLHighlighter not found
この問題の原因は何ですか?どうすれば修正できますか?