1

プログラマーのように考えることを学ぶ手助けが必要です。

私は美しいスープ 4 を使用してコンテンツを取得しています。ap タグ内に 3 つの文字列が必要です。最初の 2 つは子タグの文字列です。3つ目はpタブの文字列です。次のようになります。

<p>
<a href="some stuff">First String</a>
<br/>
<a href="some stuff">Second String</a>
<br/>
Third String
<br/>
unimportant fourth string
<br/>
</p>

各文字列を独自の変数に割り当てたいのですが、それらを分離する方法がわかりません。行に分割してから各行を割り当てることができるはずです。私のコードは現在次のようになっています。

events=body.find_all('p') #find all the p tags
for strings in events[3]: #get the first of the p tags i'm interested in
    if strings.string:
        all= str(strings.string).splitlines() #puts each string on its own line
        for line in all: #shouldn't I be able to get each line by its index?
            print line

何を試しても、3行すべてが得られます。私は何時間もかけてさまざまなことを試してきましたが、ここにいる誰かが正しい考え方を教えてくれることを願っています.

ありがとう

4

1 に答える 1

0
variable = {} # a dictionary
variable_names = ['line-1', 'line-2', 'line-3', 'line-4']

events=body.find_all('p')
for strings in events[3]:
    if strings.string:
        all= str(strings.string).splitlines()
        for i,line in enumerate(all):
            variable[variable_names[i]] = line

        # test
        print variable['line-1']
于 2012-09-19T23:01:31.100 に答える