n 個の生の URL が与えられた場合、それらをニュース、ブログ、写真、ビデオで分類できるようにしたいと考えています。
例として、リンクがユーザーを写真に誘導する場合、未加工の URL を写真として分類できるようにするには、未加工のリンクに画像のファイル拡張子が含まれていると言うだけで十分でしょうか?
動画、ブログ、ニュースに関しては、生の URL を分類する一連のドメイン ( http://www.youtube.comなど) を持つだけでは十分ではないようです。
Web コンテンツを調べて分類を行うことはできますか? または、これのためのオープンソースツールはありますか?