問題タブ [language-detection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - (人間)文書の言語
ドキュメントがどの言語で書かれているかをおおよそ知る方法(プログラム、ライブラリ)はありますか?
i18n対応のCMS(Drupal)にインポートするために、混合言語のテキストドキュメント(〜500K)がたくさんあります。
完全に一致する必要はありません。推測するだけです。
php - ドキュメントの言語を検出する方法-PHPで?
基本はすでにここで答えられています。しかし、Lingua :: Identify from CPANと同じことを行うビルド済みのPHPライブラリはありますか?
programming-languages - スニペットからプログラミング言語を検出する
コードスニペットで使用されているプログラミング言語を検出するための最良の方法は何でしょうか。
web - JavaScript などで Web ユーザーの言語を検出しますか?
私は自分のウェブサイトを多言語バージョン (英語とドイツ語など) にしようと考えています。ユーザーの言語に基づいて妥当なデフォルトを提供したいと思います。
それを行うための最も簡単で邪魔にならない方法は何ですか?
編集: 理想的な解決策は、サーバー側のテクノロジを使用するのではなく、html ファイル内のすべてをエンコードすることです。現在、メインページに自動転送する開始ページがあります。可能であれば、ドイツ語版または英語版のいずれかに転送できるように、もう少し「賢く」したいと考えています。
string - 文字列内の日本語/漢字のテスト
たくさんのテキストを読んで分析するプログラムがあります。テキストはどの言語でもかまいませんが、日本語と中国語をテストして、別の方法で分析する必要があります。
Unicode番号で各文字をテストして、CJK文字の範囲内にあるかどうかを確認できることを読みました。これは役に立ちますが、可能であれば、異なる辞書に対してテキストを処理するためにそれらを分離したいと思います。キャラクターが日本語か中国語かをテストする方法はありますか?
c# - 文字列の言語を検出する方法は?
文字列の言語を検出するための最良の方法は何ですか?
regex - Perl でロシアのスパム投稿を検出するにはどうすればよいですか?
私は perl で書かれた英語のフォーラム サイトを持っていますが、ロシア語のスパムが絶えず殺到しています。Perl と正規表現を使用してロシア語のテキストを検出し、ブロックできる方法はありますか?
php - PHP で文字列から言語を検出する
PHP で、文字列の言語を検出する方法はありますか? 文字列が UTF-8 形式であるとします。
utf-8 - PHP で CJK 文字を検出する
UTF8 文字を許可する入力ボックスがあります。文字が中国語、日本語、韓国語のいずれであるかをプログラムで検出できますか (Unicode 範囲の一部である可能性があります)。MySQL の全文検索が機能するかどうかに応じて、検索方法を変更します (CJK 文字では機能しません)。
ありがとう!