0

Web サイトからデータを読み取り、そのデータを変数に保存しようとしています。例:

http://www.example.com/example-info.php ->

名前: ボブ

住所: 1234 ストリート

電話: 000-000-0000

電子メール: Bobs-email@nothing.com

私がやりたいのは、ボブであるラベル「名前」から値を取得し、それを「ユーザー名」などの変数に格納することです。または "Telephone" を入力し、値を "Phone" という名前の変数に格納します。誰かが私を正しい方向に向けることができますか?おそらくMechanizeを使用する必要がありますか?

4

2 に答える 2

0

ウェブサイトをスクリーン スクレイピングしようとしていますか? もしそうなら、requestsまたはBeautifulSoupを使用することを検討することをお勧めします。

import requests
x = requests.get('http://www.google.com')
if x.status_code == 200:
    print x.content

x.content上記のシナリオでは、リクエストを送信したページの data/html を保持します。次に、BeautifulSoup または正規表現を使用して、必要な特定の情報を抽出できます。

于 2012-12-11T20:30:52.773 に答える
0

dictキーと値を保存するための と、翻訳のマッピング dict を持つことができます

mapping = {"Telephone": "Phone", "Name": "Username"}
details = {}

details[mapping.get(web_key, web_key)] = web_value

たとえば

>>> web_dict = {"Name": "Bob", "Address": "1234 Street", "Telephone": "000-000-0000", "Email": "Bobs-email@nothing.com"}
>>>    
>>> for web_key, web_value in web_dict.iteritems():
...     details[mapping.get(web_key, web_key)] = web_value
...
>>> print details
{'Username': 'Bob', 'Phone': '000-000-0000', 'Email': 'Bobs-email@nothing.com', 'Address': '1234 Street'}

もちろん、これは答えの半分にすぎません。最初に、html を辞書に解析するための何かが必要です。

于 2012-12-11T20:31:35.290 に答える