0

こんにちは、私は現在 RSS フィードから全文を取得しようとしています: http://www.hu-berlin.de/pr/nachrichten.rss?cat=exz . 簡単な説明と全文へのリンクのみが表示されます。

<item>
    <guid>http://www.hu-berlin.de/pr/nachrichten/nr1305/nr_130524_00</guid>
     <title>KOSMOS Summer University 2013 </title>
     <link>http://www.hu-berlin.de/pr/nachrichten/nr1305/nr_130524_00</link>
     <description>Frist verlängert: Anmeldung zum internationalen Forschertreffen bis 30. Juni möglich</description>
     <pubDate>Thu, 20 Jun 2013 00:00:00 +0200</pubDate>
  </item>

を使用して、Rにまったく同じように取得できますxmlTreeParse

XML ライブラリを使用して R で全文を直接取得できるかどうか疑問に思っていましたが、これを見つけました: XML packagein R を使用して RSS フィードを解析します。rss-to-full-texr コンバーター ( http://fulltextrssfeed.com/など) を見つけました。たぶん、これは同じものを探している他の人に役立つか、または誰もこれを調査する必要がないため、その場合は非常に基本的なものなので、ご迷惑をおかけして申し訳ありません. ヘルプや役立つリンクをいただければ幸いです。

4

1 に答える 1

0

RSS フィードの XML データに全文が含まれていません。リンクを取得し、その Web ページを取得してから、別の場所で説明されている R の HTML 解析ツールを使用して解析する必要があります。

RSS は要約形式になるように設計されているため、人間は Web ページにアクセスすることになっています。

于 2013-08-30T12:55:25.440 に答える