取得した入力データから時刻/日付の書式文字列を生成したい。これを行う簡単な方法はありますか?
私の入力データは次のようになります。
'01.12.2016 23:30:59,123'
したがって、私のコードは次のフォーマット文字列を生成する必要があります。
'%d.%m.%Y %H:%M:%S,%f'
バックグラウンド:
以前pandas.to_datetime()
は、さらに処理するために日時オブジェクトを生成していました。これはうまく機能しますが、この関数は多くのデータ (>~50k) で遅くなります (dateutil.parser.parse
ここで使用)。現時点では、コード内にハードコードされた上記のフォーマット文字列を提供して速度を上げていますが、to_datetime()
これもうまく機能します。ここで、コード内でフォーマット文字列を生成して、入力データに関してより柔軟にしたいと考えました。
編集(最初の2つの答えが私の質問に合わないため):
日時文字列ではなく、書式文字列を生成したい。
edit2 :
質問を定式化するための新しいアプローチ: 大量のデータを含むファイルを読み込んでいます。データのすべての行には、「01.12.2016 23:30:59,123」という形式のタイムスタンプがあります。これらのタイムスタンプを日時オブジェクトに変換したいと考えています。このために、現時点では pandas.to_datetime() を使用しています。この関数は完全に機能しますが、50k を超えるデータセットを含むファイルをいくつか取得したため、遅くなります。このプロセスを高速化するために、関数 pandas.to_datetime(format='%d.%m.%Y %H:%M:%S,%f') 内でフォーマット文字列を渡しています。これによりプロセスが高速化されますが、柔軟性が低下します。したがって、最初のデータセットに対してのみフォーマット文字列を評価し、それを残りの 50k 以上のデータセットに使用したいと考えています。
これはどのように可能ですか?