Gumbo の python ラッパーを使用して HTML を解析しようとしています。
私のオペレーティング システムは Ubuntu 14.04.3 LTS です。私はPython2.7を使用しています
Gumbo の最新バージョンをgithubから複製しました。
Github で提供されているインストール手順に従いました。
ライブラリ (C ライブラリと python ラッパーの両方) のインストールは成功したようです (エラー メッセージは表示されず、両方とも最後に成功メッセージが出力されました)。
C ライブラリの最終メッセージ:
ライブラリは次の場所にインストールされています: /usr/local/lib
Python ラッパー メッセージ:
/usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg インストール済み gumbo==0.10.1 の依存関係を処理中 gumbo==0.10.1 の依存関係の処理を完了
私が遭遇した最初の問題は、ライブラリをよりよく理解するために、ガンボの pydoc を開こうとしたときでした。
pydoc gumbo
次のエラーが発生しました:
problem in gumbo - <type 'exceptions.OSError'>: /usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/libgumbo.so: cannot open shared object file: No such file or directory
メッセージを検索すると、1 つの結果が得られました。
私にはあまり役に立ちませんでした。
dist-packages ディレクトリを見てみると、libgumbo.so が にないことに気付きました/usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/
。ただし、他のすべてのファイル (soup-adapter.py、gumboc.py など) は存在します。
C ライブラリをインストールすると、libgumbo.so (および libgumbo.a libgumbo.la などの他のライブラリ) が に配置され/usr/local/lib
ます。そこで、回避策として から.../dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/
への simlink を作成しました/usr/local/lib
。
これにより、pydoc ガンボが動作するようになりました。
その後、インタープリターにガンボとスープアダプターをインポートしようとしました。次のエラーを受け取りました。
import soup_adapter
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "soup_adapter.py", line 26, in <module>
import gumboc
File "gumboc.py", line 44, in <module>
os.path.dirname(__file__), _name_of_lib))
File "/usr/lib/python2.7/ctypes/__init__.py", line 443, in LoadLibrary
return self._dlltype(name)
File "/usr/lib/python2.7/ctypes/__init__.py", line 365, in __init__
self._handle = _dlopen(self._name, mode)
OSError: libgumbo.so: cannot open shared object file: No such file or directory
続行する方法や、ガンボを機能させる方法が正確にわかりません。