0

こんにちは、テキストファイルを扱うためにパンダを学び始めています。これまでのところ、numpy loadtxt を使用してきましたが、非常に古いプログラム (置き換えられない) によって生成されたいくつかのテキスト ファイルに問題があります。

[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195  4240.778  7791.743 wolf wide
 4330.00   1.3731E-13   20.000       88809.
 4350.00   1.3480E-13   20.000      117447.
 4370.00   1.5911E-13   20.000      162742.
 4390.00   1.6972E-13   20.000      183740.
 4510.00   1.8634E-13   20.000      863055.
 4530.00   1.8641E-13   20.000     1056961.
 4550.00   1.8308E-13   20.000     1215476.
 4570.00   1.7654E-13   20.000     1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037  4241.941  7793.365 F34 broad
 4400.00   2.8298E-13   50.000     1244259.
 4450.00   2.6912E-13   50.000     1978971.
 4500.00   2.5837E-13   50.000     3862673.
 4550.00   2.4811E-13   50.000     5843749.
 4600.00   2.3832E-13   50.000     7363710.

ここには、4 列のテーブルの形式でデータがあります。ご覧のとおり、2 つの長い行があります。これらは、コードが次々にスタックするさまざまなソースからのデータを表します。

それぞれの異なるソースから 1 番目と 2 番目の列からデータを抽出したいと思います。また、可能であればヘッダー行からデータを取得したいと思います。

ただし、これを行うための「pythonish」方法がどれかわかりません。ループを作成せずに各「ヘッダー」行のインデックスを識別する方法について、誰かが提供してアドバイスをくれるのではないかと思います。

いくつかの警告:

1) ヘッダー行とデータ行の両方で、列数は一定です。ただし、要素は異なる場合があります 2) データソースによっては行数が異なる場合があります

アドバイスをありがとう。

4

0 に答える 0