データを抽出してフォーマットする必要があるログ ファイルが多数あります。これらのログ ファイルの中には、10,000 行を超える非常に大きなものもあります。
テキストファイルを読み、不要な行を削除し、残りの行を特定の形式に編集するのに役立つコードサンプルを誰かが提案できますか. 私が求めているものを持つ以前のスレッドを見つけることができませんでした。
編集する必要があるデータの例を以下に示します。
136: add student 50000000 35011 / Y01T :Unknown id in field 3 - ignoring line
137: add student 50000000 5031 / Y01S :Unknown id in field 3 - ignoring line
138: add student 50000000 881 / Y01S :Unknown course idnumber in field 4 - ignoring line
139: add student 50000000 5732 / Y01S :Unknown id in field 3 - ignoring line
134: add student 50000000 W250 / Y02S :OK
135: add student 50000000 35033 / Y01T :OK
ファイルを検索し、:OK で終わる行を削除する必要があります。次に、残りの行を次のような CSV 形式に編集する必要があります。
add,student,50000000,1234 / abcd
ヒント、コード スニペットなどは非常に役に立ち、非常に感謝しています。質問する前に最初に試してみますが、Pythonファイルアクセス/文字列フォーマットを独学する時間はほとんどありません。そのため、質問する前に試していないことを事前にお詫び申し上げます。