0

データセットを iris.data としてダウンロードした後、名前を iris.data.txt に変更しました。SOで報告されたこのエラーを回避しようとしていました:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 8: invalid continuation byte

読んだ後、私はこれを試しました:

dataset = pd.read_csv('iris.data.txt', header=None, names=names,encoding="ISO-8859-1")

これによりエラーは部分的に解決されましたが、一部の行はまだガベージでした。

次に、Sublimeで開いて、utf-8エンコーディングで保存してから、dataset = pd.read_csv('iris.data.txt', header=None, names=names,encoding="utf-8")

しかし、これでも問題は解決しません。Mac OS で Python 3 を実行しています。データを直接読み取ることができる可能性があるのは何ですか?

[編集]: データ型の読み取り: Web アーカイブ。Spyder では、ファイルは iris.data.webarchive として表示されます

試してみるとdataset = pd.read_csv('iris.data.webarchive', header=None)、次のトレースバックが表示されます。

ParserError: Error tokenizing data. C error: Expected 1 fields in line 2, saw 5

私が試してみるとdataset = pd.read_csv('iris.data', header=None)、それはFileNotFoundError: File b'iris.data' does not exist

4

1 に答える 1