0

Weka データ マイニング ツールを使用して、悪意のあるコンテンツを検出および分類する方法に関するプロジェクトを行っています。アルゴリズムを開発しましたが、javascript、html、または URl の悪意のある機能を追加する方法と場所がわからないという問題があります。

例: (///) トリプル スラッシュがある場合、悪意のある URL として分類されます。同様に、アルゴリズムが分類を実行する他の機能があります。

ですので、やり方を知っている方がいましたら回答お願いします。

前もって感謝します。

4

2 に答える 2

1

この質問は、プロジェクトの機能抽出またはドメイン機能の検索に関するものです。通常、weka は既成の機能で動作します。したがって、あなたの質問は、プロジェクトの機能を見つけて使用する方法についての weka に関するものではありません。

html と javascript については手がかりになりませんが、URL 分類については以下の記事が役立つかもしれません。

Kan MY および Thi HON (2005)、「URL 機能を使用した高速 Web ページ分類」、情報および知識管理に関する第 14 回 ACM 国際会議の議事録。ニューヨーク、ニューヨーク、米国、pp. 325-326。ACM。

Ma J、Saul LK、Savage S、および Voelker GM (2009)、「ブラックリストを超えて: 疑わしい URL から悪意のある Web サイトを検出する方法を学習する」、知識の発見とデータ マイニングに関する第 15 回 ACM SIGKDD 国際会議の議事録。ニューヨーク、ニューヨーク、米国、pp. 1245-1254。ACM。

于 2013-02-06T19:39:32.867 に答える