昨日同様の質問をしましたが、別の方法でリフェーズする必要があることを認識しています。
つまり、WindowsのC ++で、文字列がUnicode形式(ワイド文字、wchar_t)であり、文字列の言語がわからない場合に、大文字と小文字を区別せずに文字列(別の文字列内)を検索するにはどうすればよいですか? 。針が干し草の山にあるかどうか知りたいだけです。針の位置は私には関係ありません。
背景:多くのメール本文を含むリポジトリがあります。メッセージはさまざまな言語(日本語、ドイツ語、ロシア語、フィンランド語、名前を付けます)で書かれています。すべてのデータはUnicode形式であり、C ++アプリケーションのワイド文字列(wchar_t)にロードします(本文はMIMEデコードされているため、デバッガーでは実際の日本語、ドイツ語の文字を確認できます)。電子メールメッセージにはその詳細が含まれていないため、メッセージの言語がわかりません。また、単一の電子メール本文に複数の言語の文字が含まれている場合があります。
私はwcsstrのようなものを探していますが、ケースに敏感でない方法で検索を実行する機能を備えています。テキストの言語を知らなければ、大文字から小文字に100%適切に変換することは不可能であることを私は知っています。可能な99%のケースで機能するソリューションが必要です。
Visual Studio 2008をC++、STL、Boostで使用しています。