問題タブ [language-detection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
940 参照

nlp - (人間)文書の言語

ドキュメントがどの言語で書かれているかをおおよそ知る方法(プログラム、ライブラリ)はありますか?

i18n対応のCMS(Drupal)にインポートするために、混合言語のテキストドキュメント(〜500K)がたくさんあります。

完全に一致する必要はありません。推測するだけです。

0 投票する
2 に答える
472 参照

php - ドキュメントの言語を検出する方法-PHPで?

基本はすでにここで答えられています。しかし、Lingua :: Identify from CPANと同じことを行うビルド済みのPHPライブラリはありますか?

0 投票する
17 に答える
104480 参照

programming-languages - スニペットからプログラミング言語を検出する

コードスニペットで使用されているプログラミング言語を検出するための最良の方法は何でしょうか。

0 投票する
4 に答える
1131 参照

web - JavaScript などで Web ユーザーの言語を検出しますか?

私は自分のウェブサイトを多言語バージョン (英語とドイツ語など) にしようと考えています。ユーザーの言語に基づいて妥当なデフォルトを提供したいと思います。

それを行うための最も簡単で邪魔にならない方法は何ですか?

編集: 理想的な解決策は、サーバー側のテクノロジを使用するのではなく、html ファイル内のすべてをエンコードすることです。現在、メインページに自動転送する開始ページがあります。可能であれば、ドイツ語版または英語版のいずれかに転送できるように、もう少し「賢く」したいと考えています。

0 投票する
6 に答える
5033 参照

string - 文字列内の日本語/漢字のテスト

たくさんのテキストを読んで分析するプログラムがあります。テキストはどの言語でもかまいませんが、日本語と中国語をテストして、別の方法で分析する必要があります。

Unicode番号で各文字をテストして、CJK文字の範囲内にあるかどうかを確認できることを読みました。これは役に立ちますが、可能であれば、異なる辞書に対してテキストを処理するためにそれらを分離したいと思います。キャラクターが日本語か中国語かをテストする方法はありますか?

0 投票する
9 に答える
28381 参照

c# - 文字列の言語を検出する方法は?

文字列の言語を検出するための最良の方法は何ですか?

0 投票する
2 に答える
1141 参照

regex - Perl でロシアのスパム投稿を検出するにはどうすればよいですか?

私は perl で書かれた英語のフォーラム サイトを持っていますが、ロシア語のスパムが絶えず殺到しています。Perl と正規表現を使用してロシア語のテキストを検出し、ブロックできる方法はありますか?

0 投票する
18 に答える
65229 参照

php - PHP で文字列から言語を検出する

PHP で、文字列の言語を検出する方法はありますか? 文字列が UTF-8 形式であるとします。

0 投票する
7 に答える
34642 参照

c# - テキストの言語を検出する

特定のテキストの言語を検出できる C# ライブラリはありますか? つまり、入力テキスト"This is a sentence"の場合、言語を として検出する必要があります"English"。または"Esto es una sentencia"、言語を として検出する必要があります"Spanish"

テキストからの言語検出は決定論的な問題ではないことを理解しています。ただし、Google 翻訳Bing 翻訳の両方に、入力言語を最適に推測する「自動検出」オプションがあります。できればC#で、公開されている同様のものはありますか?

0 投票する
3 に答える
2394 参照

utf-8 - PHP で CJK 文字を検出する

UTF8 文字を許可する入力ボックスがあります。文字が中国語、日本語、韓国語のいずれであるかをプログラムで検出できますか (Unicode 範囲の一部である可能性があります)。MySQL の全文検索が機能するかどうかに応じて、検索方法を変更します (CJK 文字では機能しません)。

ありがとう!