大学のプロジェクトのページからテキストを抽出することを目的として、Pythonでボイラーパイプライブラリを使用しようとしました。次のような抽出を行うための簡単なコードを作成しました。
from boilerpipe.extract import Extractor
def Article(url):
extractor = Extractor(extractor='ArticleExtractor', url=your_url)
extracted_text = extractor.getText()
return extracted_text
実行しようとしたときに発生するエラーは次のとおりです。
>Traceback (most recent call last):
> File "C:\Python27\Boiler.py", line 1, in <module>
> from boilerpipe.extract import Extractor
> File "C:\Python27\lib\site-packages\boilerpipe-1.2.0-py2.7.egg\boilerpipe\__init__.py", >line 10, in <module>
> jpype.startJVM(jpype.getDefaultJVMPath(), "-Djava.class.path=%s" % >os.pathsep.join(jars))
> File "C:\Python27\lib\site-packages\jpype\_core.py", line 44, in startJVM
> _jpype.startup(jvm, tuple(args), True)
>RuntimeError: Unable to load DLL [C:\Program Files\Java\jre7\bin\client\jvm.dll], error = >Não foi possível encontrar o módulo especificado.
> at src/native/common/include\jp_platform_win32.h:58
すでにJVMとJREを確認しましたが、正しくインストールされ、JAVA_HOME
環境変数が設定されています。
誰かがそれを修正する方法を知っていますか?