プロジェクト: コンテンツ ベースの画像検索 - 半教師あり (トレーニング中に手動で画像にタグ付けします)
説明
データベースには 1000000 枚の画像があります。トレーニングは手動 (監視あり) です。タイトルとタグは各画像に提供されます。例:coke.jpg タイトル:Coke タグ:Coke, Can
画像とタグを使用して、システムをトレーニングする必要があります。トレーニング後、新しい画像 (既にデータベースにある/完全に新しい) を与えると、システムは画像が属する可能性のあるタグを出力し、各タグに属するいくつかの画像を表示する必要があります。一致が見つからないというメッセージが表示される場合もあります。
質問:
1) 画像指紋とは何を意味しますか? 予想される画像の指紋サイズは? (データベースには何百万もの画像が挿入されるため、重要です)
2) データベース内のその指紋のフィールド形式は何ですか? (高速検索が必要なため重要です...スクリプトは 100 万の画像データベースを 1 秒未満で検索する必要があります)
3) それらを分析するために使用する記述子 (アルゴリズム) は何ですか?
前もって感謝します