私はテキストファイルにデータを持っていて、それをデータベースに保存する必要がありますが、今ではそれを簡単にする方法を少し混乱させています。
これが私のデータの例です:
a: text1
b: text2
c: text3
blah blah not necessary text
a: text4
b: text5
c: text6
etc
それで、私がこのデータを解析するのを手伝ってくれませんか。私はすでに次のコードを実行しました
import urllib2 as ur
def getPageData(url):
return ur.urlopen(url).readlines()
checkList = ['a', 'b', 'c']
if __name__ == '__main__':
textList = getPageData(url)
res = []
for i in textList:
for y in checkList:
if y in i:
print i
ベースにテーブルを作成します
id | a varchar | b varchar | c varchar |
そして私は次の結果を期待しています
id | a varchar | b varchar | c varchar |
1 | text1 | text2 | text3 |
2 | text4 | text5 | text6 |
n | text | text | text |
テキストファイルを1行ずつ読み取る場合、このテキストを論理ブロックに分割するにはどうすればよいですか。たとえば、このデータを使用してa、b、cの辞書を作成し、次にこのブロックが終了したら、辞書をリストに追加します。その後、リストを作成します。それをベースに保存するための辞書の。しかし、この辞書を使用してこのリストを作成する方法と、チェックする必要があるもの、およびその中の不要なデータを回避する方法を少し混乱させましたか?これを行うためのよりエレガントな方法はありますか?