問題タブ [python-newspaper]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Newspaper3k ライブラリ - ペイウォールの背後でのスクレイピング
サブスクリプションを持っている場合、Newspaper3k ライブラリを使用してペイウォールの背後をかき集める方法はありますか?
URL リクエスト メソッドに直接アクセスできないため、たとえばセッション Cookie を渡す方法がわかりません。これを行う方法はありますか?
python - Python の NewsPaper ライブラリを使用して、ニュース記事を 1 つのリストにスクレイピングしますか?
親愛なる Stackoverflow コミュニティ!
CNN RSS フィードからニュース記事をスクレイピングし、スクレイピングされた各記事のリンクを取得したいと考えています。これは Python NewsPaper ライブラリで非常にうまく機能しますが、残念ながらリストや辞書などの使用可能な形式で出力を取得できません。
スクレイピングされたリンクを、多数の個別のリストではなく、1 つの SINGLE リストに追加したいと考えています。
出力は次のとおりです。
すべてのリンクを含む 1 つのリストが必要です。
次のように for ループを介してコンテンツを追加しようとしました。
しかし、出力は次のようになります。
コンテンツを1つのリストに入れる方法を知っている人はいますか? または、次のような辞書:
ご協力ありがとうございました!!
python - ループ中にPythonの新聞関数が記事のURLを読み取っていませんか?
これがばかげた質問である場合はお詫びします。私は Python を初めて使用し、Excel VBA に精通しています。
Excel ドキュメントに格納されている複数の記事の URL を Python でループさせ、さまざまな URL の要約を作成しようとしています。目標は、記事のタイトル、要約、および URL を新しい Excel (または別のタブ) にエクスポートすることです。(最終的な目標は、関連するニュースをかき集めて要約することですが、私はそれに向けて取り組んでいます!)
ただし、作成したリストから渡された URL を新聞記事関数で読み取るのに問題があります。URL を印刷すると、単にコピーして貼り付けて url = 'the copy pasted value' を設定した場合とまったく同じように見えます。ただし、その URL で「Article」関数を実行すると、URL が正しく読み取られないようです。それらは文字列としてリストに格納されます。何が間違っているのかわからない。どんな助けでも大歓迎です!!
Python から次の出力が得られます。
記事を印刷する代わりに、URL でエラーが発生しているようです。
洞察はありますか?前もって感謝します!!