今の私のスキルをはるかに超えたプロジェクトになるかもしれませんが、丸 1 か月ほどは費やすことができるので、できると思います。私が構築したいのはこれです: さまざまな情報源から特定の主題に関するニュースを収集します。簡単ですよね?RSS フィードを取得してページに表示するだけです。うーん、もっと高度な機能が欲しい: 重複を削除し、カスタマイズされたプレゼンテーション (つまり、ニュースの見出しが表示される形式を定義/変更できる)。
私は Yahoo Pipes やその他のツールを少し使ってみましたが、2 つの大きな問題に直面しています。
- 一部のソースは RSS フィードを提供していません。作成方法を教えてください。
- 重複を見つけて削除する最良の方法は何ですか。見出しを比較して、たとえば 50% を超える一致があるかどうかを確認することを考えました。しかし、それは良い習慣ですか?
私が考えていなかったかもしれない他のこと(問題、提案など)を追加してください.