問題タブ [phonetics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
spell-checking - Metaphone 3 アルゴリズムとは何ですか?
Metaphone 3 アルゴリズムを自分でコーディングしたいと考えています。説明はありますか?ソース コードが販売されていることは知っていますが、それは私が探しているものではありません。
machine-learning - メタフォン対サウンデックス対NYSIIS
私は、入力単語のある種のより一般的な音声表現へのマッピングを使用して、発生する可能性のあるタイプミスを説明する暗黙のスペルチェッカーを考え出そうとしています。基本的には、ある程度まで自動的にスペルを修正する検索バーです。 。私が調べているのは、metaphone、nysiis、soundexの2つですが、このアプリケーションにどちらが適しているかはわかりません。
一致数を少なくするよりも優先的に多くしたいので、もう少し一般的な一致をしたいので、元のメタフォンよりも近似的なマッピングのように見えるsoundexを使用することを考えていました。でも曖昧さの違いがどれだけ大きいのかはよくわかりません。nysiisがsoundexにかなり似ていることは知っていますが、それらがどれほど似ているか、またはnysiisがmetaphoneとどのように比較されているかについてはよくわかりません。
また、実行が最も速いソリューションを探しています。これらのふりがなは通常かなり速いことは知っていますが、検索時間を長くせずにスペルをチェックできるようにしたいことを考えると、どちらが最も速いかはわかりません。速度が考慮されます。考え?
algorithm - 文字列が発音できるかどうかを確認するにはどうすればよいですか?
文字列を発音できるかどうか、またはスペルアウトする必要があるかどうかをプログラムで確認したいと思います。
たとえば、internationalization
読み取ることはできますが、読み取ることはi18n
できませんhhdirgxzf
。
文字列にアルファ文字以外の文字が含まれているかどうかを確認するなど、いくつかの単純なヒューリスティックを考えることができますが、それを行うためのより堅牢で科学的な方法があることを願っています。発音のしやすさに基づいて文字列をスコアリングできるアルゴリズムアプローチはありますか?
関連:単語の発音の難しさをランク付けする方法はありますか?、しかし、私はリストを持っておらず、事前計算することはできません。
コメントに基づいて更新します。
- 私は英語を話すので英語に興味がありますが、特定の言語の特性ではなく、音と話し方に基づいたアルゴリズムを想像することができました。
- 発音とは、文字列を自然に読み上げることができ、発音は可能
hhdirgxzf
ですが、1つの自然言語の単語に聞こえないため、分割する必要があることを意味します。 - 私が念頭に置いている特定のユースケースは、文字列が送信される場合であり、基本的なテキスト読み上げシステムを使用して文字列を読み上げたいと考えています。文字列内のどのトークンをTTSシステムに発音させ、どのトークンをスペルアウトさせるかを決定したいのですが、自信がない場合はスペルアウトの側で誤りがあります。
python - 複数の単語を含む名前に Python で音声アルゴリズムを実装する方法
次のような投稿をたくさん読みました。
そして調べてみると、ダブル メタフォン コードが見つかりました。
しかし、二重メタフォン アルゴリズムは、文字列が 1 つの単語であると仮定して、指定された文字列のタプルを返します。同じ名前の複数の単語で機能する音声アルゴリズムを知っている人はいますか? そうでない場合は、この列の各単語の単語数をカウントするスクリプトを作成し、データセットで最も頻繁に発生するセル内の単語に対して double metaphone を実行するのが最善の方法ですか?
c# - lucene.net音声フィルター
テキストデータをluceneに保存しようとしています。
検索はふりがなで行う必要があります。
ふりがなをどこに追加すればよいですか?
よろしく、インゴ
java - スキャナーを使用してこの switch ステートメントを機能させるにはどうすればよいですか?
アルファベットの任意の文字 (大文字または小文字) を音声アルファベットに切り替えるプログラムを作成しようとしています。たとえば、「A」または「a」と入力すると、プログラムによって「Alpha」が表示されます (変更されます)。私はこれと switch ステートメントについて非常に多くの調査を行ってきましたが、行き詰まり続けています。スキャナーで「char」を使用できないことに気付きました。ただし、「char」を「String」に変更すると、switch ステートメントが台無しになります (具体的には、コード内のtoUpperCaseに下線が引かれます。間違いがわかりません。これまでに行ったことは次のとおりです。
dll - C#XSAMPAを使用して単語の音素スペルを取得する
インターネットでこれを行うためのリソースと方法を探していますが、リンクを見つけることができます。
これを行うことができる唯一の場所は、単語を入力できるこのリンクであり、 SAMPAでその単語の音素的スペルを提供します。
この男はxsampaの行に何かを投稿しましたが、彼がそれらのクラスを取得する方法などについては何もわかりません。これがC#でも可能かどうか、そしてこれに関するリソースはどこにありますか?
あなたの翻訳がJULIUSでどのように機能するように見えるべきか。
例:
最初にそれをSampaに変換してから、単語をJuluisと互換性のあるX-sampaに置き換えるか、マッピングを直接使用してX-Sampaに変換する必要があります。
ios - 音声学的に同じ音を識別するための iOS のライブラリはありますか
iOSアプリケーションを構築しようとしています。画面の 1 つで、ユーザーが検索バーに何かを入力すると、同じ単語の異なるスペルに対して同じアクションを実行する必要があります。
例:ユーザーは"elephant"または"alephant"または"elefant" と入力できます。この 3 つの単語すべてに対して同じアクションを実行する必要があります。
これらの単語を類似のものとして識別するライブラリはありますか? 英語以外の言語でもこれが必要なため、スペルチェッカーを使用できません..調査を行ったところ、サーバー側でこれを実現するための Text::soundex のような音声アルゴリズムがいくつかあることがわかりました。iOS用のライブラリがあるかどうか疑問に思っていますか?
前もって感謝します !!
phonetics - コンピューターで生成された音声と人間の声の音の類似性
ふりがなを使って2つのサウンドファイルを比較するアルゴリズムを探しています。ある種のスコアを評価したい(例:0:類似性なし、100:同じ音)。そこで、Audacityに「こんにちは」と言って生成され録音された人間の声をロードし(私は知っています、それはそれほど専門的ではありません...)、波を見ました。
https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png(残念ながら、画像を埋め込むことはできません)
どちらも完全に同じように聞こえますが、波はそれほど一致していません。
これらの2つの波の間の類似性を検出し、言及されたスコアを計算する方法はありますか?
search - Solr音声検索で何も見つからない
私のsolr 4.1.0のインストールでは、音声エンコーディングで何も見つかりません。schema.xml からの抜粋:
text_suggest
は多かれ少なかれ元のテキストを小文字化し、solr.StandardTokenizerFactory
とでトークン化したものsolr.WordDelimiterFilterFactory
です。フォネティック エンコーダーは、ドイツ語の単語に特化したものです。同義語フィルターは、一部のドメイン固有の単語を処理します。http://www.cominvent.com/2012/01/25/super-flexible-autocomplete-with-solr/に触発されました。
「Geprüfter Betriebswirt」のエントリと、textsuggest のその他の項目のインデックスを作成します。「Betriebswirt」を検索すると、期待どおりの結果が得られます。ただし、元のドイツ語の小さなスペルミスである「Betribswirt」を検索すると、solr は 0 件のヒットを報告します。
solr の管理 GUI の分析ビューで、「Betriebswirt」とフィールド タイプの異なるスペルを試してみtext_phonetic_do
ましたが、それらはすべて同じ数値ストリームにエンコードされます。
- betriebswirt => 12718372
- betribswirt => 12718372
- betribswiirt => 12718372
- ペトリブスウィート => 12718372
したがって、エンコーディング (分析時間と検索時間) は期待どおりに機能します。しかし、上で述べたように、solr は音異表記を検索してもドキュメントを見つけられません。
クエリ ビューを使用していますが、クエリでさえtextphon:Betriebswirt
1 つの結果が返されません。クエリの完全な結果 (タイミングの部分を削除しました) は次のようになります。
なぜ何も見つからないのかわかりません。デバッグ出力を正しく理解している場合、インデックスは正しい(読み取り:音声的にエンコードされた)トークンを検索することさえできます。
それで、私は何が欠けていますか?誰かが私を正しい方向に向けることができますか? ありがとう