さまざまな言語(現在、3つの言語が修正されています)でユーザー入力を受け入れるアプリケーションを扱っています。要件は、ユーザーがテキストを入力でき、UIに用意されているチェックボックスを使用して言語をわざわざ選択しないことです。
テキストの言語を検出するための既存のJavaライブラリはありますか?
私はこのようなものが欲しい:
text = "To be or not to be thats the question."
// returns ISO 639 Alpha-2 code
language = detect(text);
print(language);
結果:
EN
私は自分で言語検出器を作成する方法を知りたくありません(私はそれをしようとしているブログをたくさん見ました)。ライブラリは単純なAPiを提供し、完全にオフラインで動作する必要があります。オープンソースでもコマーシャルクローズでも構いません。
私はまた、SO(およびさらにいくつか)でこの質問を見つけました: