1

BeautifulSoupを使用してhtmlをjsonに変換するためにプログラムに数行のコードを追加しましたが、それらの追加されたコード行に対してエラーが発生しました。

import httplib, urllib
from bs4 import BeautifulSoup
import json

params = urllib.urlencode({'cmm': 'onion', 'mkt': '', 'search': ''})
headers = {'Cookie': 'ASPSESSIONIDCCRBQBBS=KKLPJPKCHLACHBKKJONGLPHE; ASP.NET_SessionId=kvxhkhqmjnauyz55ult4hx55; ASPSESSIONIDAASBRBAS=IEJPJLHDEKFKAMOENFOAPNIM','Origin': 'http://agmarknet.nic.in', 'Accept-Encoding': 'gzip, deflate', 'Accept-Language': 'en-GB,en-US;q=0.8,en;q=0.6','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.93 Safari/537.36', 'Content-Type': 'application/x-www-form-urlencoded','Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8', 'Cache-Control': 'max-age=0','Referer': 'http://agmarknet.nic.in/mark2_new.asp','Connection': 'keep-alive'}
conn = httplib.HTTPConnection("agmarknet.nic.in")
conn.request("POST", "/SearchCmmMkt.asp", params, headers)
response = conn.getresponse()
print response.status, response.reason
data = response.read()
htmldata = [[cell.text for cell in row("td")]for row in BeautifulSoup((data)("tr"),"lxml")]
x = json.dumps(dict(htmldata))
print x

次のようなエラーが表示されます

Traceback (most recent call last):
  File "commodity.py", line 12, in <module>
    data1 = [[cell.text for cell in row("td")]for row in BeautifulSoup((data)("tr"),"lxml")]
TypeError: 'str' object is not callable`enter code here`

コードの実行について。このエラーを解決するための正しいアプローチを教えてください。

4

1 に答える 1

1

ここで文字列を「呼び出そう」としています:

BeautifulSoup((data)("tr"),"lxml")

(data)は文字列であり、文字列(data)("tr")への呼び出しです。

<tr>おそらく、すべての要素を見つけたいと思うでしょう:

BeautifulSoup(data, "lxml").find_all("tr")

完全な声明を作成する:

htmldata = [[cell.text for cell in row("td")] for row in BeautifulSoup(data, "lxml").find_all("tr")]
于 2015-09-26T09:44:51.740 に答える