“language-model”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

1198 参照

java - 言語モデリングツールキット

テキストコーパスの言語モデルを構築したいと考えています。私の仕事を軽減するすぐに使える優れたツールキットはありますか? 私が知っている唯一のツールキットは、CMU による統計言語モデリング (SLM) ツールキットです。

よろしく、

2010-07-21T13:52:04.620

0 投票する

1 に答える

499 参照

java - Javaで非常に短時間で非常に大きなARPAファイルを検索します

ほぼ 1 GB の ARPA ファイルがあります。1分以内に検索する必要があります。私はたくさん検索しましたが、適切な答えはまだ見つかりません。ファイル全体を読む必要はないと思います。ファイル内の特定の行にジャンプして、その行全体を読み取るだけです。ARPA ファイルの行の長さが同じではありません。ARPA ファイルには特定の形式があることに言及する必要があります。

ファイル形式

サンプルファイルでわかるように、1 グラムが 19 行、2 グラムが 234 行、3 グラムが 1013 行あります。行の文字列部分をプログラムに渡し、文字列の左側と右側にある数字を取得します。入力文字列は、ファイルのどの部分を検索する必要があるかを知るのに役立ちます。ファイルが非常に大きく、ファイル全体を読み取るには時間がかかるため、ファイルを完全に読み取らない方法を見つける必要があります。インデックスファイルを使わずにファイル内の特定の行にジャンプして行全体にアクセスするのは良い方法だと思います。

あなたが私の任務を遂行するのを手伝ってくれるなら、それは素晴らしいことです。

java n-gram language-model

2011-02-26T15:05:08.567

0 投票する

1 に答える

1175 参照

speech-recognition - Sphinx 4 は ARPA LM を破損しましたか?

SPHINX を実行すると、 kylmによって生成された ARPA LM があり、次の例外スタックトレースが表示されます。

ARPA LM の抜粋を次に示します。

PS :後に改行があります\end\

例外は、SPHINX が最後の行で予期しない EOF に遭遇していることを示しています (そこで EOF に遭遇するはずではありませんか??)

助けてください！

speech-recognition speech-to-text n-gram sphinx4 language-model

2011-02-28T14:03:23.590

0 投票する

2 に答える

6706 参照

iphone - openears互換の言語モデルの構築

私は音声合成と音声合成の開発を行っていますが、OpenEarsAPIが非常に便利であることがわかりました。

このcmu-slmベースのAPIの原理は、言語モデルを使用して、iPhoneデバイスで聞いた音声をマッピングすることです。そこで、API音声認識エンジンにフィードするための大きな英語モデルを見つけることにしました。しかし、OpenEarsで使用するvoxfourge英語データモデルの形式を理解できませんでした。

英語の.languagemodelファイルと.dicファイルをOpenEarsで動作させるにはどうすればよいか考えている人はいますか？

iphone speech-recognition language-model

2011-03-07T14:08:44.050

0 投票する

2 に答える

7165 参照