1

私はファイルの基本pd.read_tableをやってい.txtます。最初の列は cusips のリストです。cusip"65248E10"は数値として読み取られます65248E10 = 652480000000000(科学表記法として E10)。

私はパンダを経験してきましたが、それをキャラクターとして維持することを要求する方法がわかりません. http://pandas.pydata.org/pandas-docs/dev/generated/pandas.io.parsers.read_table.html#pandas.io.parsers.read_table

また、header=0 を入れても、1 行目をヘッダーとして、0 行目を 2 行目というように入れているようです。テキスト ファイルに列名がない場合、デフォルトで NULL (または 1、2、3 など) にするにはどうすればよいですか?

助けてくれてありがとう。私はパンダ/パイソンが初めてです

4

2 に答える 2

2

次のようなデータファイルがある場合

65248E10 11
55555E55 22

次に、次のようなものでそれを読み取ることができます

>>> pd.read_table("cusip.txt", header=None, delimiter=" ", converters={0: str})
          0   1
0  65248E10  11
1  55555E55  22

ここではheader=None、ヘッダーがないことdelimiter=" "を伝えるために使用し、スペース区切り文字があることを伝えるために使用し (データ形式に合わせて調整します)、converters={0: str}最初の列を文字列として読み取った後、さらに処理するのではなく、文字列に変換します (つまり、この場合は何もしません)。の代わりにconverters={0: str}も機能しますが、この方法でも、他の列が何であるかを把握dtype=(str, int)できます。pandas

使用に関する問題header=0は、0ここでは「ヘッダーなし」を意味するのではなく、行番号 #0 (最初の行) をヘッダーとして使用することを意味することです。

于 2012-12-27T19:47:41.583 に答える
1

列が数値として読み取られないようにするには、convertersパラメーターを使用しstrて、「cusips」を含む列のコンバーターとして指定します。

ヘッダーについては、リンク先のページに記載されているように、ヘッダーと見なされる行header番号です。「ヘッダーがあるかどうか」というブール値ではありません。ゼロに設定すると、ヘッダーとして行0(つまり、最初の行)を使用することを意味します。ドキュメントには明示的に次のように記載されています。

ヘッダー行がない場合は、None を指定します。

于 2012-12-27T19:46:59.400 に答える