python - PythonでWebサイトからデータを抽出しようとしています

翻译自：https://stackoverflow.com/questions/50813906 2018-06-12T09:37:16.710

92 次

def convert():
    for url in url_list:
        news=Article(url)
        news.download()
        while news.download_state != 2:
            time.sleep(1)
        news.parse()
        l.append(
            {'Title':news.title, 'Text': news.text.replace('\n',' '), 'Date':news.publish_date, 'Author':news.authors}
        )

convert()
df = pd.DataFrame.from_dict(l)
df.to_csv('Amazon_try2'+'.csv',encoding='utf-8', index=False)

関数 convert() は、url のリストを調べて、それぞれを処理します。各 URL は記事へのリンクです。著者、テキストなどの記事の重要な属性を取得し、これをデータフレームに格納しています。その後、データフレームをcsvファイルに変換しています。url_list には 589 個の URL があったため、スクリプトは約 5 時間実行されました。しかし、まだcsvファイルを取得できませんでした。誰かが私が間違っているところを見つけてくれますか?

python - PythonでWebサイトからデータを抽出しようとしています

2 に答える 2

Related

Reference