単語を定義して単語の出所を見つけることができるAPIがJavaにあるのではないかと思っていました。しばらく前にこれを検索して「apachecommons」を見たのを覚えていますが、よくわかりません。
したがって、基本的に、ユーザーは「オーバーフロー」という単語を入力できるようになり、プログラムはその単語を定義できるようになります。だから私は単語を定義し、単語の起源を見つけることができるAPIを探しています。したがって、「recherche」という単語の語源は「French」になります。
WordNetはあなたが探しているものの半分をあなたに与えるでしょう:あなたは単語の定義を調べることができます。WordNet for Javaには、 jwi、jaws、Dan Bikel 、WordnetAPIなどのいくつかの実装があることに注意してください。これらのいくつかは、mikuによって提案されたjwordnetよりもあなたの目的のために使いやすいかもしれません(私は顎とjwiだけを使用しました)。
注:WordNetはあなたに起源(AFAIK)を与えません。私はそうするソフトウェアを知りません。
注:辞書で検索できるようにするには、単語の見出語を指定する必要があります。これは、フリーテキストドキュメント(屈折したフォームを含む可能性がある)でこれを自動的に実行する場合は、いくつかの自然言語処理(NLP)手法を適用する必要があることを意味します。このルートを使用する場合は、GATEプロジェクトのMorphプラグインをお勧めします。
Wordnetかもしれませんか?そのためのJavaラッパーがあります:http ://sourceforge.net/projects/jwordnet/
NLPツールキットの別のリスト:
言語を検出するには:
語源のウェブサイトがあります:http ://www.etymonline.com/
それは結果を与えます:神父からのrecherche1722。recherché「慎重に探し出した」、rechercherのpp。「探し出す」。一般的に使用される19c。あいまいな卓越性を示すための食品、スタイルなどの。
APIを取得したかどうかはわかりませんが、何らかのスクリプトを使用してクエリを実行します。
だから、「神父」を検出する良い方法を見つけてください。上記の文で。
乾杯、エリック
JWKTLをお探しですか?
「ウィクショナリーは、ウィキペディアの語彙コンパニオンとして設計された、多言語、Webベース、無料で利用できる辞書、シソーラス、およびフレーズブックです。最近、自然言語処理アプリケーションの有望な語彙セマンティックリソースとして認識されています。」
これを使用して、単語の語源を確認できます。