NY タイムズから記事の見出しを取得しようとしています。
しかし、Firefoxで「要素の検査」を使用した場合にのみ表示されるため、htmlはjavascriptによって生成されていると思います。どうすれば記事にアクセスできますか? おそらく、その方法の 1 つはブラウザーをエミュレートすることですが、それはやり過ぎのように思えます。Javaでこれを行うことを好みますが、Pythonでも問題ありません。あなたの助けに感謝します!
編集:APIを使用してみました。しかし、悪い URL がたくさんあります (ページが見つかりません)。URLと見出しを取得する方法について、他に何かアイデアはありますか?