30

この技術を使っているサイトがYoutubeだけかどうかはわかりませんが、YTにおけるコンテンツ識別(Content ID)は基本的に著作権侵害を自動的に識別して取り除く技術です。詳細については、こちらをご覧ください。

http://www.youtube.com/t/contentid

私のビデオ (特定の音楽トラックを含む) の 1 つがタグ付けされ、著作権侵害のために削除されたとき、[コンテンツ ID システム] はおそらくばかげていると思いました。だから私はいくつかの実験をしました: どれもフィルターを騙しませんでした~

  • 曲の途中に一連のビープ音を追加
  • 曲中に何度か音程を変えた
  • 音量を数回変更しました
  • 速度を調整しました
  • オーディオオーバーレイを追加
  • いくつかのオーディオエフェクトを追加

一方で、著作権で保護されていると誤って一致している素材は知りません。たとえば、曲のピアノバージョンは、検閲を誤ってトリガーしません。

自分の動画が削除されたことについて怒っているわけではありません。コンテンツ検閲がどれほど効果的であるかに驚いています。あらゆる努力をして回避しようとしたにもかかわらず、アルゴリズムがその曲を著作権を侵害しているとどのように正しく識別するのか疑問に思っています。直接一致させる試みはすぐに失敗し、ノート パターンを含むアルゴリズムは、ビープ音とピッチ シフトにだまされる可能性があります。

まあ、これは緊急の質問というより私の好奇心です..

4

1 に答える 1

22

Pedro Morenoと Google/Youtube の他のメンバーがこれに取り組んでいます。有限状態変換器を使用して、自動音声認識の音素と同様に、音楽の単音単位のシーケンスを認識します。

この記事をチェックしてください:

曲全体で速度やピッチを変更しても、これらのアルゴリズムがまだ曲を認識していることに驚きました。しかし、元のバージョンだけでなく、カバーされたバージョンも認識できるように、(ビート間の時間を使用して) ピッチと速度を正規化する可能性があります。しかし、オーディオ ストリームには十分な類似性があるため、追加したビープ音を無視できることは驚くべきことではありません。

(実際、有限状態ベースのアルゴリズムを私の iTunes ライブラリに適用して、ファイルを正しくタグ付けするのは素晴らしいことです。MusicBrainzのようなサービスは、多かれ少なかれオーディオとデータベース エントリの正確なハッシュ マッチに依存しているのに対し、トランスデューサー法はファイルを認識する際に、より違いに寛容になるようにします。)

于 2009-03-16T03:35:51.160 に答える