テキストの検索、画像の検索、さらには動画の検索にも、さまざまな検索手法がいくつ存在するのか、常に疑問に思っていました。
ただし、オーディオ ファイル内のコンテンツを検索するソリューションに出会ったことはありません。
例:約 200 のポッドキャストが mp3、wav、および ogg ファイルの形式で PC にダウンロードされているとします。それらはすべて一般的に podcast1.mp3、podcast2.mp3 などの名前が付けられています。そのため、実際に聞いてみないと内容を知ることはできません。つまり、どのポッドキャストが「ゲーム プログラミング」について話しているかを知りたいと思っています。結果を次のように表示したい:
- Podcast1.mp3 - 時間インデックスの 3 つの結果 - 0:16:21、0:43:45、1:12:31
- Podcast21.ogg - 時間インデックスで 1 件の結果 - 0:12:01
だから私の質問:
- この問題にどのようにアプローチできますか?
- このようなことを行うために開発された適切なアルゴリズムはありますか?
私の頭に浮かんだアイデアの 1 つは、「音声テキスト変換」ソフトウェアを使用して、各オーディオ ファイルの時間インデックスと共にトランスクリプトを取得し、トランスクリプトを解析して出力を取得できるというものでした。
私はこれを私の趣味のプロジェクトの 1 つと考えていました。ありがとう!