Nokogiri を使用して XML フィードを取り込みましたが、問題なく動作しています。取得する必要がある新しいフィードが追加されましたが、一度に読み込まれません。ブラウザーで xml フィードにアクセスすると、最初の一連のデータが読み込まれ、その後すぐにさらにデータが読み込まれることがわかります。Nokogiri を使用すると、データの初期セットを取得するだけです。curl を使用してフィードをキャプチャしようとしたところ、同じ結果が得られました。
XML フィードからすべてのデータを取得するにはどうすればよいですか? Nokogiri に渡すことができるオプションや、curl に設定できるフラグはありますか? Nokogiri のドキュメントと curl の man ページを見ましたが、わかりません。
データを(のこぎりまたはカールを使用して)下に引っ張ると、次のようになります(ただし、2つ以上のアイテムがあります)。
<?xml version="1.0" encoding="UTF-8"?>
<item-syndication version="5">
<item id="1">
<more-data >lorem ipsum</more-data>
</item>
<item id="2">
<more-data >lorem ipsum</more-data>
</item>
</item-syndication>
ブラウザーで URL にアクセスすると、最初は上記のように見えますが、次のようにさらに多くのアイテムが読み込まれます (最終的に 4 つを超えるアイテムが表示されます)。
<?xml version="1.0" encoding="UTF-8"?>
<item-syndication version="5">
<item id="1">
<more-data >lorem ipsum</more-data>
</item>
<item id="2">
<more-data >lorem ipsum</more-data>
</item>
<item id="3">
<more-data >lorem ipsum</more-data>
</item>
<item id="4">
<more-data >lorem ipsum</more-data>
</item>
</item-syndication>
最初のリクエストのリクエスト ヘッダーとレスポンス ヘッダーは次のとおりです。
参考までに、favicon のリクエスト ヘッダーとレスポンス ヘッダーを次に示します。