38

単なる単語リストではなく、英語の辞書を TXT、XML、SQL などの構造化された形式でダウンロードしたいと考えています。

具体的には、音声発音品詞が必要です (定義は必要ありません)。

驚いたことに、私はこれをオンラインでどこにも見つけることができません。ウィクショナリーダウンロードできますが、MediaWiki の記事自体のみです。すべての記事をクロールし、音声学と品詞を抽出するのは大変な作業です。

これはどこでも入手できますか?払っても構わない。

編集:何人かが私に何をしたいか尋ねてきました。私の当面の必要性はただの好奇心です。たとえば、「最も一般的な 2 音節の動詞は?」などです。最終的には、正しい品詞と音声一致のボーナス ポイントを組み合わせることで、利用可能なドメイン名を見つけるのに役立つツールになることを願っています。

注: English Language and Usageに相互投稿されています。

4

5 に答える 5

17

http://www.speech.cs.cmu.edu/cgi-bin/cmudictにアクセスすると、発音辞書のダウンロード ページがhttps://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunkにあります。 /cmudict/

現在の最新バージョンは cmudict.0.7a です。

これは、 http://www.haikuvillage.comの音節カウンターを実装するために現在使用しているものです。これは Ruby で作成されており、お役に立てれば喜んでオープン ソース化します。

于 2010-09-30T08:11:13.427 に答える
8

高度に構造化された形式のパブリック ドメインの音声辞書の一部: http://icon.shef.ac.uk/Moby/mpos.html

各行は×で区切られたエントリで、左側に単語の値、右側に品詞の値 (動詞など) があります。シンプルなテキストファイル。

于 2013-08-07T16:41:26.670 に答える
6

Wordnetは私が知っている最高の辞書の1つです。おそらくあなたはそこに何かを見つけるでしょう: http ://wordnet.princeton.edu/wordnet/related-projects/

于 2010-09-29T14:14:37.420 に答える
2

Portman さん、私は DevExpress の SpellChecker ツールを使用していましたが、OpenOffice 辞書が存在することは知っていましたが、それらの辞書には明確に定義されたデータ構造があると確信しています。無料/有料のテキスト読み上げツールと組み合わせて使用​​することをお勧めします.

それが役立つことを願って、

于 2010-09-25T16:20:03.183 に答える
1

これはあなたの質問に対する直接的な回答ではありませんが、Double Metaphone アルゴリズムは、検索エンジン アプリケーション サーバー (Solr など) の単語またはフレーズの一致を見つけるのに非常に優れています。

これが何を意図して使用されているかはわかりません。そのため、私の提案が役立つかどうかはわかりません。意図した用途に近い場合は、Double Metaphone に関するウィキペディアのページに、探索する価値のある約 12 の実装のリストがあります

http://en.wikipedia.org/wiki/Double_Metaphone

于 2010-09-27T18:57:02.810 に答える