次のようなオンライン アプリケーションを作成したいと考えています。
- ブラウザのアドレスバーからURLを読み取ります
- その字句特徴を抽出します (n-gram など)
- ホストベースの機能を抽出します (DNS レコードをオンラインで取得し、その A、PTR、TTL フィールド)
- URL を悪意のあるものと無害なものに分類する (機械学習を使用)
1と3について誰か教えてください。
次のようなオンライン アプリケーションを作成したいと考えています。
1と3について誰か教えてください。
URLに基づいてサイトのコンテンツを実際に判断できないため、これ(アプリケーション)が達成できるタスクであるとは思いません。
代わりに、 Mozilla Phishing Protection の設計ドキュメントや Google セーフ ブラウジングの仕様などを参照してください。
どの言語を見ているのかわかりません。
アイテム1については、おそらく役立つ.netライブラリがあります
http://msdn.microsoft.com/en-us/library/system.web.httputility.aspx