問題タブ [sound-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - MS Visual C# でディクテーションしますか?
テキスト エディターを作成したいのですが、他のテキスト エディターとは異なります。音声からコマンドを取得します。
例えば ; 私は自分の名前をマイクに向けて「Ibrahim AKGUN」と言います..すると、このプログラムはそれを取得し、仮想秘書のように書き留めます:)
これは C# で可能ですか?
c# - C# での拍手音の検出
拍手音を検出できるようにしたいと思います。あらゆる形式の音声認識にかなり慣れていないので、これを行う簡単な方法はありますか? そうでない場合は、C# の音声認識/検出に適したリソースはありますか?
私の目標は、いくつかの基本的な拍手ベースのコントロールを使用して、クライアントのメディア センターを自動化することです。
android - サーバー側の推定/オーディオファイルの類似性の認識のためのフレームワーク/アルゴリズム/ライブラリ?
録音されたオーディオファイルをサウンドデータベースと比較し、類似性メトリックを報告するAndroidアプリを実装したいと思います。このアプリはShazamのように機能しますが、データベースのオーディオファイルと照合されます。サーバー上で音声認識/比較を行うための適切なアルゴリズムを実装するオープンソースプロジェクトを誰かに教えてもらえますか?ありがとう
delphi - デルファイの.wav標本を比較する方法は?
.wav
2つのファイルを比較して標本の研究を始めたいと思います。継続時間、アクセント、発音の結果をパーセンテージで返すようなものです。など、またはを比較/分析するコード.wav
。
audio - ソフトウェア: ソフトウェアはどのように曲を認識しますか?
私は自分の携帯電話で遊んでいましたが、このアプリがあり、それを使用して曲を 10 秒間録音すると、その曲のタイトルと作者が表示されます。今、ソフトウェア エンジニアとして、これはどのように機能するのだろうかと疑問に思わずにはいられません。
iphone - iPhoneアプリの音認識?
マイク入力を録音し、特定の音に反応するアプリを入手しようとしています。これらのサウンドは事前に録音され、Webサイトやテレビなどの別のデバイスで再生されます。
ですから、オーディオデータを比較するのが問題だと思います。始めるのに良い場所について何かアイデアはありますか?
c# - c# を使用した音楽 (ジャンル) 認識
学校の目的で C# で音楽認識アプリケーションを実行する必要があります (一部の音楽ジャンル - スタイルの認識)
これを行うための良い方法 (ソース、API、ライブラリ、記事) をお勧めできますか?
どうもありがとう。
audio - ハミングアプローチによるクエリ
ここで質問するのが適切かどうかはわかりません。私は学士号を取得するためのコース プロジェクトを開発しています。これは基本的に、ユーザーが口ずさんで入力することで曲を検索するサービスです。
効率的で、多かれ少なかれ実装が簡単な最良のアプローチを提案できる人はいますか。おすすめの記事を教えてください。このプロジェクトを完了するのに約 2 か月かかります。そして、私はすでにいくつかの予備調査を行っており、私の選択は MIDI ファイルを使用するアプローチでした。現在、MIDI を作成するための適切なソフトウェアが見つからないため、別のアプローチに変更しようとしています (変換は非常に複雑なプロセスであり、この種のソリューションに投資する時間が十分にあるかどうかわかりません)。
周波数ドメイン解析に基づくアプローチは、どれほど効率的かつ正確でしょうか?
.net - mp3ファイルから曲情報を取得するための.NETSDK(認識)
MP3ファイルを入力として音楽情報(アーティスト、アルバム、年など)を取得するためのSDK / Webサービスはありますか?androidのSoundhoundに似ていますが、.NETで使用するためのAPIとして
編集:たぶん、私はそれほど明確ではありませんでした。入力:ID3情報のないMP3ファイル。出力:曲の情報(SoundhoundやShazamなどのWebサービス/データベースを使用した認識によって取得)
具体的には。プレイリスト内の曲を右クリックして->ファイル情報を表示->自動タグ付けしたときにWinAmpが行うことを正確に行う必要があります
.net - 音声を分析して結果を保存する方法は?
アプリを作ろうと思っています。
説明は次のとおりです。 1. 人々は以前に録音した会話をサーバーにアップロードします。2. サーバーからのアプリケーションは、その声のピッチ、速度、強調、発音などを検出し、個人のポートフォリオを作成します。3. サーバーに電話をかけると、サーバー アプリケーションはその人の正確な声の調子であなたと話します (その人の音声サーバーはステップ 2 で検出されました)。
このプロジェクトに役立つと思われるリンク、リソース、PDF プレゼンテーションを共有してください.....
主にSTEP 2で立ち往生しています。音声を分解して分析し、速度、ピッチなどの情報を取得する方法が明確にわかりません。音声部分で使用できる既存のAPIはありますか?