私は何百ものビデオとオーディオ ファイルの機械による自動トランスクリプトを持っています。JSON、XML、SRT、VTT、TXT の 5 つの形式ですべてのトランスクリプトを用意しています。(サンプル ファイルを表示するには、ここをクリックしてください。) JSON ファイルと XML ファイルには、話者 ID、信頼レベル、タイムコードなど、最も包括的なデータが含まれています。
このデータをマイニングまたは検索して単語やフレーズを見つける方法を探しています。ブール検索クエリを送信し、結果をクリックして、テキスト結果のタイムコードでビデオ/オーディオ ファイルを再生できるようにする必要があります。必要なブール演算子は、NOT、AND、OR のみです (オンライン検索エンジンと同様)。検索例: ("野球のバット" AND 公園) OR サッカー
かなりシンプルなインターフェースを考えています。
基本オプション:
- 検索ボックス
- 最小信頼レベル スライダー
高度なオプションのアイデア:
- スピーカー: "Bob,Joe,Bill" (つまり、スピーカーはこれらのいずれかでなければなりません)
- AND 検索の単語間の最大許容時間: XX 秒
- 完全一致フレーズ検索の単語間の最大許容時間: XX 秒
- 完全一致フレーズ検索の単語は同じ話者でなければなりません: ON/OFF
- AND の間の単語には同じスピーカーが必要です: ON/OFF
- OR 間の単語には同じスピーカーが必要です: ON/OFF
- AND の間の単語は、時系列で見つける必要があります: ON/OFF
- 句読点を無視: ON/OFF
簡単に言えば、Agent Ransack のようなタイムコードと、可能であればその他のオプションが必要です。 これが非常に具体的で複雑な要求であることは承知しています。 :) このアイデアについて手がかりを教えてもらえますか? 車輪の再発明はしたくありません。これらすべてを実行できるのに最も近いのは、どのソフトウェア/コマンド ライン プログラム/エンジンですか? ひょっとしたらそこから適応できるかもしれません。
ありがとう!