0

私が持っているデータファイルは次のようになります:

Title
10000XX   1.09876543e+02

この形式には、列 1 の値が 1000000 から 2000099 の範囲で、列 2 の値が -9000 から 9000 の範囲で、負の指数を持つ値を含む多くの行があります。私は正規表現に非常に慣れていないので、どんな助けも役に立ちます。私のプログラムの残りの部分はPythonで書かれているので、私は以下を使用しています:

re.search()

この構文に関するいくつかのヘルプは素晴らしいでしょう。ありがとう

4

1 に答える 1

3

ロバートが言うように、関数をそのまま使用できsplit()ます。

セパレーターが質問のようにスペースであると仮定すると、以下のコードを実行して値のリストを取得し、それを好きなように実行できます。

>>> line = "10000XX   1.09876543e+02"
>>> line.split()
['10000XX', '1.09876543e+02']

で 2 番目の項目を浮動小数点数に変換できますfloat()。例えばfloat('1.09876543e+02')

行を繰り返し処理し、数字で始まらない行は無視してください。

正規表現はもう少し面倒です。

于 2012-06-11T18:31:21.260 に答える