私は社会科学者であり、コーディングに関してはまったくの初心者です。他の質問/チュートリアルを検索しましたが、特にコメント セクションを対象とするニュース Web サイトをクロールする方法の要点を得ることができません。理想的には、多くのページをクロールし、すべてのコメントを .txt ファイルとして返すように python に指示したいと思います。私はもう試した
from bs4 import BeautifulSoup
import urllib2
url="http://www.xxxxxx.com"
bs4
はモジュールではないというエラー メッセージが表示される前に、私ができる限りのことです。これについて何か助けていただければ幸いです。返信する場合は、DUMB IT DOWN でお願いします。
ターミナルで実行wget
して、Web サイトからあらゆる種類のテキストを取得できます。個々の出力 html ファイルを 1 つの大きな .txt ファイルに保存する方法を実際に理解できれば、すばらしいことです。いずれかのご質問にお答えいたします。