良い HTTP GET 要求と悪いものを区別する必要があるアプリケーションがあります。
For example:
http://somesite.com?passes=dodgy+parameter # BAD
http://anothersite.com?passes=a+good+parameter # GOOD
My system can make a binary decision about whether or not a URL is good or bad - but ideally I would like it to predict whether or not a previously unseen URL is good or bad.
http://some-new-site.com?passes=a+really+dodgy+parameter # BAD
I feel the need for a support vector machine (SVM) ... but I need to learn machine learning. Some questions:
1) SVM はこのタスクに適していますか? 2) 生の URL でトレーニングできますか? - 「機能」を明示的に指定せずに 3) 予測がうまくいくにはいくつの URL が必要ですか? 4) どの種類の SVM カーネルを使用すればよいですか? 5) トレーニング後、最新の状態に保つにはどうすればよいですか? 6) 目に見えない URL を再度 SVM でテストして、それが良いか悪いかを判断するにはどうすればよいですか? 私