1

区切り文字ctrl + aでcsvファイルを書き込もうとしています。最終的にファイルを Hadoop に書き込む必要があり、標準の区切り文字を使用できません。

現在、私はこれを試しています:

writer = csv.writer(f, delimiter = "\u0001")
for item in aList:
     writer.writerow(item)

f.close()

ただし、出力された Excel ファイルは正しく書き込まれていないようです... 1 つのブロックに凝縮されている行もあれば、最初のフィールドに 1 つのフィールドがあり、残りが 2 番目のブロックに凝縮されている行もあります。

エラーはライター オブジェクトを設定している場所ですか、それともこの方法でファイルを分割することに慣れていないだけですか?

4

1 に答える 1

0

Pythonコードで「\ 035」として表すことができる、印刷されない「グループ区切り」文字を使用してみてください。

さらに必要な場合は、他の印刷されない文字について http://www.asciitable.com/index/asciifull.gif を参照してください。

非標準の区切り文字を使用する理由について、より多くのコンテキストを含めると役立つ場合があります。また、ファイルの Excel 解析が必要かどうか、またはファイルがターゲット システムである Hadoop によって適切に解析されるかどうかを簡単に確認するだけでよいかどうか。

于 2013-05-18T21:08:21.490 に答える