1

私が使う:

Data = np.genfromtxt(filename, delimiter='"\t"', dtype=None, autostrip=True, skip_header=1)

そして、処理中に ValueError(errmsg) を発生させます

Line #33 (got 3 columns instead of 27)

しかし、そうではありません。その行のファイルには、すべての列があります! 私はチェックしました-関数は、いくつかのシンボルまで「欠損値」のある行を読み取ります:たとえば、33行目で関数はこれを読み取ります:

"http://www.savvyeat.com/whole-wheat-chocolate-chai-muffins/"   "2152"  "{""title"":""Whole Wheat Chocolate Chai Muffins Savvy Eats "",""body"":""I think I subconsciously sabotaged myself Two weeks ago I couldn t

他の方法で numpy 配列のファイルを読み取るか、この問題を何らかの方法で修正するにはどうすればよいですか?

4

1 に答える 1

1

この種の問題は、CSV ファイルの内容を確認できればすぐに解決できるはずです。問題をデバッグするには、次を実行します。

import itertools as IT
with open(filename, 'rb') as f:
    content = ''.join(IT.islice(f, 50))
    print(repr(content))

出力を投稿します。これにより、ファイルの最初の 50 行が得られます。機密データがある場合は、投稿する前に編集できます。引用符をそのままにしておき\tます。

于 2013-08-31T09:46:37.800 に答える