すべてが''タグで始まり、' PT J
'タグで終わる数百のレコードを含むISIファイルを解析していますER
。ネストされたループ内の各レコードからタグ付き情報を取得しようとしていますが、IndexErrorが発生し続けます。なぜ取得したのかはわかりますが、最初の数文字をチェックするよりも、新しいレコードの開始を識別するためのより良い方法はありますか?
while file:
while line[1] + line[2] + line[3] + line[4] != 'PT J':
...
Search through and record data from tags
...
私はこれと同じ方法を使用しているため、タグの識別で同じ問題が発生することがあります。そのため、何か提案があれば、よろしくお願いします。
各レコードのすべてのタグが常に含まれているとは限らないサンプルデータは次のとおりです。
PT J
AF Bob Smith
TI Python For Dummies
DT July 4, 2012
ER
PT J
TI Django for Dummies
DT 4/14/2012
ER
PT J
AF Jim Brown
TI StackOverflow
ER