問題タブ [python-newspaper]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
1397 参照

python - 感情分析のためのニュース アグリゲーター

私は小さなニュース感情分析アプリをPythonで書いています。ニュース記事のデータベースを作成して分類器をトレーニングしたいので、ウェブからニュース記事を取得するための最善の方法を考えています。クールなモジュールのように見え、非常に一般的ですが、私が探しているのは古いニュース記事、つまり 2014 年のすべてのニュース記事を取得する方法ですもう 1 つのオプションは、Google ニュース用のスクレーパーを作成し、URL で日付でフィルタリングするか、NYT などの発行者の API を使用することです (API があります)。

このようなニュース記事データベースを作成するにはどうすればよいでしょうか? 記事を入手するために使用できるツール/データベースは Web 上にありますか?

0 投票する
1 に答える
1558 参照

python - 新聞で複数のURLから記事をダウンロードする

記事をダウンロードしたいURLのリストがあるWebページ(zeit online、ドイツの新聞)から複数の記事を抽出しようとしてきたので、URLのページをクロールする必要はありません。

Python 用の新聞パッケージは、1 ページのコンテンツを解析するのに素晴らしい仕事をします。すべての記事がダウンロードされるまで、URL を自動的に変更する必要があります。残念ながら、私はコーディングの知識が限られており、それを行う方法を見つけていません。誰かが私を助けてくれたら、とても感謝しています。

私が試したことの1つは次のとおりです。

これでうまくいくようですが、リンゴとバナナを少なくするもっと簡単な方法があると思います。

0 投票する
2 に答える
7624 参照

python - Python 新聞ライブラリの使い方

Webパーサーを作ろうとして保存しました。新聞図書館を見つけました。私はエクリプスを使用しています。しかし、良い結果を得ることができませんでした。私を助けてください。

これはエラー メッセージです。

0 投票する
0 に答える
134 参照

python - 中国語の記事を抽出する方法

これが一番整備されているようだったので試してみました。また、グースとボイラーパイプのどちらも機能しませんでした。

後で翻訳したい:

0 投票する
1 に答える
1391 参照

python - 新聞図書館での発行日は必ず返す なし

最近は新聞図書館をよく利用しています。私が見つけている唯一の問題は、いつarticle.publish_date私が常に得ているかということですNone

たくさんの URL を調べています。publish_date返却する前にを印刷していることがわかります。

前に言ったように取得します:

他のすべての機能は意図したとおりに機能しています。サイトのドキュメントは例を見て、

私はこれをやっています私はかなり確信しています。誰かが私の問題を見ていたかどうかはわかりません。

0 投票する
0 に答える
202 参照

python - 一方のマシンでは Python インポート エラーが発生するが、もう一方のマシンでは発生しない

新聞と呼ばれるライブラリを使用して、アプリをエラスティック Beanstalk にデプロイしています。ローカルでは正常に実行されますが、サーバーでは機能せず、次のエラーがスローされます。

両方のマシンで python 2.7.9 が実行されています。
問題は何でしょうか?

確認のために、requirements.txt を使用して依存関係を読み込んでおり、両方のマシンで問題なく読み込まれています。

0 投票する
1 に答える
4923 参照

python - Python パッケージ (新聞) インストール エラー

以下のエラーで失敗したパッケージをインストールしようとしています。setuptools をググってインストールしましたが、それでも同じエラーが発生します。

指示:pip install newspaper