マイクに向かって話したことを録音し、すべての単語を抽出するアプリを作成したいと考えています。
これは多くの企業や個人が取り組んでいる問題であることは承知していますが、これを得意とするツールの開発からどれだけ離れているかはよくわかりません。
また、これを達成するために公開されているツールはありますか? Google アシスタント、Apple Siri、またはオーディオ クリップをアップロードして単語を取得するだけで使用できる API が提供されることを願っています。
マイクに向かって話したことを録音し、すべての単語を抽出するアプリを作成したいと考えています。
これは多くの企業や個人が取り組んでいる問題であることは承知していますが、これを得意とするツールの開発からどれだけ離れているかはよくわかりません。
また、これを達成するために公開されているツールはありますか? Google アシスタント、Apple Siri、またはオーディオ クリップをアップロードして単語を取得するだけで使用できる API が提供されることを願っています。
Google にはGoogle アシスタント SDKがありますが、主な目的は、ソフトウェアまたはデバイスから音声を送信し、アシスタントからの音声応答を受信することです。Google Home と同様です。同様に、Actions on Googleは、すべての自然言語処理 (NLP) を処理し、応答を提供することを目的としています。(副作用ではありますが) 言われたことを正確に提供するわけではありません。
Speech to Text (STT) システムであるCloud Speech APIが必要なようです。これを、生成されたテキストから意味を解析できるCloud Natural Language APIのようなものと組み合わせることができます。