こんにちは、テキストファイルを扱うためにパンダを学び始めています。これまでのところ、numpy loadtxt を使用してきましたが、非常に古いプログラム (置き換えられない) によって生成されたいくつかのテキスト ファイルに問題があります。
[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195 4240.778 7791.743 wolf wide
4330.00 1.3731E-13 20.000 88809.
4350.00 1.3480E-13 20.000 117447.
4370.00 1.5911E-13 20.000 162742.
4390.00 1.6972E-13 20.000 183740.
4510.00 1.8634E-13 20.000 863055.
4530.00 1.8641E-13 20.000 1056961.
4550.00 1.8308E-13 20.000 1215476.
4570.00 1.7654E-13 20.000 1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037 4241.941 7793.365 F34 broad
4400.00 2.8298E-13 50.000 1244259.
4450.00 2.6912E-13 50.000 1978971.
4500.00 2.5837E-13 50.000 3862673.
4550.00 2.4811E-13 50.000 5843749.
4600.00 2.3832E-13 50.000 7363710.
ここには、4 列のテーブルの形式でデータがあります。ご覧のとおり、2 つの長い行があります。これらは、コードが次々にスタックするさまざまなソースからのデータを表します。
それぞれの異なるソースから 1 番目と 2 番目の列からデータを抽出したいと思います。また、可能であればヘッダー行からデータを取得したいと思います。
ただし、これを行うための「pythonish」方法がどれかわかりません。ループを作成せずに各「ヘッダー」行のインデックスを識別する方法について、誰かが提供してアドバイスをくれるのではないかと思います。
いくつかの警告:
1) ヘッダー行とデータ行の両方で、列数は一定です。ただし、要素は異なる場合があります 2) データソースによっては行数が異なる場合があります
アドバイスをありがとう。