pandas ライブラリで .read_html() 関数を使用しようとしていますが、シェルでコードを実行するとこのエラーが発生し続けます。lxml をインストールする必要があることがわかったので、apt-get を使用してインストールしました。しかし、その後、もう一度実行しようとすると、同じエラーが発生しました。
(trusty)mdz5032@localhost:~$ sudo apt-get -y install python-lxml
[sudo] password for mdz5032:
Reading package lists... Done
.
.
.
python-lxml is already the newest version.
0 upgraded, 0 newly installed, 0 to remove and 1 not upgraded.
これが私が使用しているコードです
import pandas as pd
import pandas_datareader.data as web
import quandl
df = quandl.get("FMAC/HPI_PA", authtoken="")
fiddy_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')
APIキーを取り出しましたが、必要に応じて投稿できます。
ここに完全なトレースバックがあります
Traceback (most recent call last):
File "/home/mdz5032/pandasPractice.py", line 9, in <module>
fiddy_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')
File "/usr/local/lib/python3.4/dist-packages/pandas/io/html.py", line 874, in read_html
parse_dates, tupleize_cols, thousands, attrs, encoding)
File "/usr/local/lib/python3.4/dist-packages/pandas/io/html.py", line 726, in _parse
parser = _parser_dispatch(flav)
File "/usr/local/lib/python3.4/dist-packages/pandas/io/html.py", line 685, in _parser_dispatch
raise ImportError("lxml not found, please install it")
ImportError: lxml not found, please install it