私はpythonの使用が初めてです。しかし、私のデータ処理で使用するために練習によって学びます.
ここに示すような形式のビッグ データ ファイルがあります。
行と列の数は常に不明です。この例では、2 つの連続した行が表示されています。
1 列目は「時間」で、n 列目は識別子から選択される関連データです (1 行目の「abc」)。
................
"2013-01-01 00:00:02" 228 227 15.65 15.84 14.85 14.68 14.53 13.75 12.45 12.55
"2013-01-02 00:01:03" 225 227 16.35 15.99 14.85 14.73 14.43 13.8 12.85 13.2
.................
望ましい出力
- 時間差を計算できるように、Column1 = 時間単位。
- 列 (n) = データはさらに処理されます。float である必要があります。
私の過去の試行では、リストになってしまうため、どちらの列も変換できません。
過去の質問と回答を検索してみました。しかし、私は初心者なので、すべてを解釈できませんでした。後で処理できるように、データを列形式に読み込むための迅速な支援を期待しています。より数学的な操作であるため、さらに処理を行うことができると思います。
本当にお世話になりました。
よろしく
ゴウリ
訂正-1: pandasは、以前に必要だった列を抽出するためのコンパクトなバージョンを提供する
ことを理解しました。グループからの提案の後、良い学習。
コードは次のようになります。
import pandas as pd
data = pd.read_csv(fp, sep='\t')
entry=[]
entry = data['u90']
print entry, '\n', entry[5]
out_file = open("out.txt", "w")
entry.to_csv(out_file)
よろしく
ゴウリ