id
、name
およびを含むいくつかのユーザー情報を格納するjsonファイルがありurl
ます。json ファイルは次のようになります。
{"link": "https://www.example.com/user1", "id": 1, "name": "user1"}
{"link": "https://www.example.com/user1", "id": 2, "name": "user2"}
このファイルは、スクレイピー スパイダーによって作成されました。ここで、json ファイルから URL を読み取り、各ユーザーの Web ページをスクレイピングしたいと考えています。しかし、jsonファイルからデータをロードできません。
現時点では、これらの URL を取得する方法がわかりません。最初にjsonファイルから行を読むべきだと思います。Pythonシェルで次のコードを試しました:
import json
f = open('links.jl')
line = json.load(f)
次のエラー メッセージが表示されました。
Raise ValueError(errmsg("Extra data", s, end, len(s)))
ValueError: Extra data: line 2 column 1- line 138 column 497(char498-67908)
私はオンラインでいくつかの検索を行いました。検索では、json ファイルにフォーマットの問題がある可能性があることが示唆されました。しかし、json ファイルは、scrapy パイプラインを使用して作成され、項目が取り込まれました。エラーの原因を知っている人はいますか? そして、それを解決する方法は?URL の読み取りに関する提案はありますか?
どうもありがとう。