私はインターネットページからさまざまな入力を取得するアプリケーションの開発に取り組んでいますが、各情報スニペットは異なる場所(マッシュアップ)から取得されます。ビジュアルツールを使用してマッシュアップビルディングブロック(スニペット)を生成したいと思います。そのようなプロジェクトに使用できる同様の何かを知っていますか?(すでに制御、サンプルコード、記事などが作成されています。)推奨される開発環境は.NETですが、必須ではありません。
1 に答える
IMO の主な課題は、各フィードから適切な情報をセマンティック形式で抽出することです。ウィキペディアでは、マッシュアップを次のように説明しています。
マッシュアップには、コンシューマ マッシュアップ、データ マッシュアップ、エンタープライズ マッシュアップなど、さまざまな種類があります。最も一般的なタイプのマッシュアップは、一般大衆を対象としたコンシューマ マッシュアップです。
データ マッシュアップは、複数のソースからの類似した種類のメディアと情報を 1 つの表現に結合します。その一例が AlertMap です。これは、厳しい気象条件、バイオハザードの脅威、および地震情報に関連する 200 を超えるソースからのデータを組み合わせて、それらを世界地図に表示します。もう 1 つは、シカゴの犯罪率と犯罪の場所を示すシカゴ犯罪マップです。
古典的なマッシュアップ - シカゴ犯罪 - が機能するのは、日付や地理位置情報などの重要な情報が意味的に利用できるためです。他の種類の一般的な情報には、個人、組織、およびドメイン固有の識別子があります。
これらを特定したら、セマンティック Web が開発している RDF ベースのツールを検討することをお勧めします。政府は RDF でデータを公開し始めていることに注意してください。したがって、私はこれを重要なテクノロジーと見なします。
Web ページにセマンティック情報がすぐにない場合は、おそらくスクリーン スクレーパーと HTML パーサーを作成する必要があります。それはあまり魅力的ではありません。特別なツールはなく、大変な作業になる傾向があります。