問題タブ [feedparser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - yahooWeatherrssを使用したpythonfeedparser
私はfeedparserを使用してyahoosweatherrssからいくつかのデータを取得しようとしています。フィードパーサーがyweather名前空間データを削除するようです。
http://weather.yahooapis.com/forecastrss?w=24260013&u=c
feedparserはそれを完全に無視しているようです。それを手に入れるために離れていますか?
python - Feedparser よりも最新の Python 用 RSS フィード API はありますか?
しばらく更新されていないようで、sy:updateFrequency などのサポートが不足しています。
ruby-on-rails - FeedZirraのインストール中にエラーが発生しました
RubyonRailsは初めてです。フィードの解析にワクワクしていますが、FeedZirraをインストールすると、このエラーが発生します。
私はWindows7とRuby1.8.7を使用しています。
助けてください。前もって感謝します。
python - feedparser - さまざまなエラー
プロジェクトにfeedparser ( http://www.feedparser.orgを参照) が必要で、サードパーティのモジュールを別のフォルダーに保存したいと考えています。これを行うには、python パスにフォルダーを追加し、関連するモジュールをそこに配置します。
feedparser をインポートするこの最初の試みは、
ファイルの下部にあるコメントに「socket timeout; added...」というテキストが見つかり、これらのコメントを削除して、再試行しました。
わかりました、インデントエラーです。問題の関数のインデントが問題ないことを確認しました(一部の行を移動すると、インデントなしになります)。そして再試行しました:
私がグーグルで調べた限り、構文に問題は見つかりません。
それで?私のアプローチはすべて間違っていますか?十分にテストされ、信頼されているように見えるモジュールでこれらのエラーが発生し続けるのはなぜですか?
python - ユニバーサル フィード パーサーに関する質問
クロールしたいくつかのブログ フィードからコンテンツを取得する際に問題が発生しました。
理由はわかりませんが、feedparser で 1 つまたは 2 つのブログを解析すると、次の特定のエラーが返されます。
オブジェクトには属性「コンテンツ」がありません
また
オブジェクトには属性「リンク」がありません
これは、私の他のブログの残りの部分には当てはまりません。空のエントリ コンテンツはこれになりますか?
perl - Perl CGI スクリプトで RSS フィードを解析するには、どのモジュールを使用できますか?
Perl CGI スクリプトで使用できる RSS パーサーを探しています。私が見つけsimplepie
たのは、PHP スクリプトで使用するのが非常に簡単なパーサーです。残念ながら、これは Perl CGI スクリプトでは機能しません。など、使いやすいものがあれば教えてくださいsimplepie
。
私はこのRssDisplayに出会いましたが、その使用法とその良さについてはよくわかりません。
django - FeedJack が過去のフィードを取得する方法
私はニュース集約 Web サイトを構築しており、システムに (特定の Web サイトの) 古いフィードを取得する方法を探しています。このコースで、私はFeedjackに出くわしました。私が必要としていたものを処理すると言われています。そこで、ソースコードに飛び込み始めました。(django プロジェクトに直接プラグインしたくありません。) 表示されるのは次の行だけです。
これが履歴フィードの解析をどのように処理するかはわかりません。私が欠けているものを知っているかもしれません。もう 1 つ質問があります。フィードジャックは言うまでもなく、ウェブサイトの過去のフィードにアクセスするにはどうすればよいですか?
python - Python フィードパーサーは atom/WordPress 名前空間を使用していませんか?
WordPress エクスポート ファイルを解析するためにfeedparser (優れたライブラリ)を使用しようとしています。
atom:link
WordPress 2.x は、XML 出力 ( without_atom_tags.xml ) にタグを含めません。解析すると、名前空間付きの要素はプレフィックスなしで利用できます。
WordPress 3.x の XMLにはタグ ( with_atom_tags.xml )が含まれているため、名前空間要素のプレフィックスを付ける必要があります。atom:link
興味深いことに、xmlns:atom="http://www.w3.org/2005/Atom"
ルート RSS 要素 ( with_atom_tags_and_namespace.xml ) に追加する場合、プレフィックスは必要ありません。
XML を変更せずに、これらのさまざまな形式をすべて解析する必要があります。フィードパーサーが壊れていますか、それとも間違っていますか? 厄介な条件付きコードの束なしでこれを行うことはできますか?
python - 最終的なリダイレクト URL を取得する方法
フィードの URL を取得するために Google アプリ エンジンを使用していますが、いくつかの URL は 301 リダイレクトです。結果を返す最終的な URL を取得したいです。
URLを解析するためにユニバーサルフィードリーダーを使用していますが、最終的なURLを取得できる方法または関数があります。
google-app-engine - Google App Engineでurllib2を使用してタイムアウトを宣言するにはどうすればよいですか?
Google App EngineでUrlfetchのラッパーとして利用できることは承知してurllib2
います。ご存知のように、UniversalFeedparserはurllib2を使用します。
urllib2にタイムアウトを設定する方法を知っていますか?
urllib2のtimeout
パラメータはGoogleAppEngineバージョンに移植されていますか?
私は次のような方法には興味がありません: