問題タブ [python-newspaper]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 繰り返しから出力を取得し、それを辞書に保存する方法
そこで、Google API と Newspaper を使用して、このスクリプト (Python 3.5 を実行) を作成しました。グーグルで睡眠に関する記事を検索します。そして、Newspaper を使用して、これらの URL を反復処理します。私が Newspaper に求めているのは、その記事のキーワードのリストを返すことだけですarticle.keywords。
(特定の記事に対して) 返されるキーワードは次のようになります。
しかし、すべての結果のすべてのキーワードでいっぱいの辞書を作成したいと思います。つまり、反復される各記事のキーワードです。どうすればいいですか?
python - Python 3: 特定のキーワードを含むニュース記事を取得するにはどうすればよいですか?
キーワードを含むニュース記事の感情を返す小さな Web アプリを作成しようとしています。
TextBlob と Newspaper3K python 3 パッケージを使用しました。Newspaper3K の URL 文字列を Google ニュースの検索クエリの結果にしようとしましたが、新聞パッケージは Google ニュースの「メイン ページ」にリダイレクトされるようです。
特定のキーワードを含む新聞記事のリストを取得する方法はありますか? さらに、新聞がページを繰り返すことは可能ですか?
以下は私のコードです:
python - Python - Newspaper Library - 記事のかなりの部分が欠けているのはなぜですか?
ここにある新聞ライブラリ V. 2.7 を使用しています。
テキストをダウンロードして解析し、印刷すると、記事の実際よりもはるかに小さな部分しか表示されません。どうしてこれなの?これを修正する方法はありますか?
これが私のコードです:
印刷されたものをオンラインで実際の記事と比較すると、article.text が実際の記事の最初の 7 ~ 8 段落をスキップしていることがわかります。「完全な」記事がキャプチャされていることを確認する方法はありますか?
article_object.text の出力は次のとおりです。
u'全国共和党は血のにおいがして、上院を奪還するためのドライブの一環として、ここでテレビ広告に何百万ドルも費やしています. 新しい広告の 1 つでは、野球帽をかぶった男性が、マンチン氏がワシントン ジョーに変身するだろうと予測し、「オバマを止めなければならない」と宣言しています。\n\n写真\n\n マンチンは、民主党が過半数を占めているが保守的な価値観を持つこの州で、すべての正しいボタンを押したと考えていました。彼は 2008 年に 70 パーセントの得票率で知事として 2 期目を勝ち取り、財政責任を称賛されました。Raese氏でさえ彼を良い知事と呼んでいます。彼は、商工会議所、全米ライフル協会、および石炭産業と鉱山労働者の両方から支持されています.\n\nMr. マンチンは、彼の保守的な信任状と独立の記録を強調しており、彼は敵対者が\u201cf中傷のキャンペーンを行っていると非難しています.\u201d.過去3回の大統領選挙でジョン・マケイン上院議員とブッシュ大統領に州を与えた。 . \u201cManchin は上院に行き、オバマのゴム印になると思う.\n\n彼は Raese 氏のメッセージをほぼ一言一句繰り返して言った.\n\n石炭が繁栄の源と見なされている州では、 Raese 氏は、彼が言うところの、Mr 氏のあいまいな発言を把握しました。温室効果ガスを削減するためのキャップ・アンド・トレード・システムの提案に関するマンチン。マンチン氏は現在、この問題について明確に語っています。彼はインタビューで、キャップ アンド トレードと炭素税に断固として反対していると強調しました。\n\n水曜日、マンチン氏は石炭への支持を強調し、社長と距離を置く。州議会議事堂で彼の側にいる石炭生産者協会の会長と共に、彼は州が 2 つの連邦機関を訴え、2009 年にオバマ政権によって採用された山頂での石炭採掘に対するより厳しい規制を撤回しようとしていると発表しました。\ n\n広告 本編を読み続ける\n\n環境保護局と陸軍工兵隊に対する訴訟について話し合っている. マンチン氏は、より厳格な手続きは違法であり、新しい採掘プロジェクトを遅らせることで州に損害を与えたと述べ、オバマ政権が石炭産業と生活様式を破壊しようとしていると非難した.\u201d\n\nEPA はこれに応じた.その行動が法的にも科学的にも健全であること。\n\nMr. マンチン氏、独立した専門家、そしてウェスト バージニア石炭協会でさえ、マンチン氏が発電所での石炭の使用を 25% 禁止する州法を可決したと非難する Raese の広告に異議を唱えました。\u201d\n\n実際、この法律はは、よりクリーンな石炭を含む新しいエネルギー技術の進歩を求めており、業界の支持を得ていました。\n\n Raese はまた、Obama の健康計画を歓迎する過去の声明について知事を非難しました。氏 マンチン氏は、子供の補償範囲の保護など、計画の中核となる要素のいくつかは良いが、他の要素は廃止すべきだと述べています。Raese 氏は、完全に破棄されるべきである純粋で純粋な社会主義の医療計画を、多くの中小企業経営者に訴えるメッセージと呼んでいます。\n\nPhoto\n\nMr. Raese は屈強で自信に満ちた男で、以前は上院議員や知事に立候補したことがあり、現在は流れが自分の道を流れていると感じています。\u201c オバマケアが直面しているとき、キャップ アンド トレードが直面しているときに、どのようにビジネス プランをまとめますか?\u201d 彼は本拠地であるモーガンタウンの共和党事務所でのインタビューで尋ねました.\n\ nさん Raese は、石灰岩鉱山と製鋼会社を経営し、ラジオ ネットワークと新聞の共同所有者でもあります。彼は全国に少なくとも 3 つの家を持っており、彼の妻はフロリダ州パーム ビーチの家に住んでいますが、彼はウェスト バージニア州に住んでいます。彼のナフタと自由貿易への明確な支持と労働組合への反対は、ブルーカラーの遺産を持つ州では彼を助けないかもしれません. マンチン氏のキャンペーンでは、Raese 氏が受け継いだ富を自慢し、最低賃金やその他の労働者保護に反対していることを強調する広告を掲載しました。 、彼らは彼の雇用創出の記録を賞賛し、彼らがキャリア政治家と見なす人を選ぶのではなく、新しい顔をワシントンに送る準備ができていました. \n\n広告 続きを読む\n\nこれまでに公開された唯一の世論調査は、自動化された\u2014\u2014 個人的なインタビューなしで\u2014行われたものであり、信頼できるものとして広く受け入れられていません. しかし、両陣営による私的世論調査は予想外の接戦を示している.\n\n53 歳のチャールストンの弁護士であるフォード フランシスは、知事としてのマンチン氏が好きだと語った \u2014しかし、連邦政府の赤字が急増することを心配し、政府が経済に与える影響が大きすぎると考えているため、レイズ氏に投票する方向に傾いているとのことです。マンチン氏をワシントンの度を越したもので描くのは不公平だ。\u201c彼はウェストバージニア州にいたので、私は彼に投票することに傾いています. 彼女と彼女の夫の社会保障と年金の小切手が請求書をカバーしていなかったため、店員として再び働き始めなければなりませんでした. 彼女は、誰が勝っても退職者が保護されることを望んでいる、と彼女は言った。2008年にマンチン氏に投票したが、政権の経済政策に悩まされている経済保守派であるチャールストンの51歳のクレジットアナリストは、おそらくいつでも彼は私の投票を獲得しただろう. \n\n\u201c彼を上院の議席に入れることは、民主党の地位を強化するだろう、と彼の会社が知事のオフィスと取引をしているため、彼の名前を明かすことを拒否した男は言った。\u201c私たちはむしろ彼を知事としてここに留めておきたい.\u201d'
python - Python: Newspaper モジュール - URL から直接記事を取得する方法はありますか?
ここにあるPython用の新聞モジュールを使用しています。
チュートリアルでは、異なる新聞の建物をプールして同時に生成する方法について説明しています。(上記のリンクの「マルチスレッドの記事のダウンロード」を参照してください)
URL の LIST から直接記事を取得するためにこれを行う方法はありますか? つまり、次のセットアップに複数の URL を送り込み、それらを同時にダウンロードして解析する方法はありますか?