さまざまな言語で書かれたタイトル文字列があるとしましょう。
各文字列がどの言語であるかを確認する方法はありますか?
私はそれで遊んだことはありませんが、NSLinguisticTaggerとその- (NSOrthography *)orthographyAtIndex:(NSUInteger)charIndex effectiveRange:(NSRangePointer)effectiveRange
メソッドを確認する必要があります。NSOrthography ドキュメントから:
NSOrthography クラスは、通常、スペル チェックと文法チェックの目的で使用されるテキストの言語コンテンツを記述します。
NSOrthography インスタンスは次のことを説明します。
テキストに含まれるスクリプト。これらの各スクリプトの主要な言語と、場合によっては他の言語。テキスト全体の支配的なスクリプトと言語。スクリプトは、標準の 4 文字のタグ (Latn、Grek、Cyrl など) で一様に記述され、スーパータグの Jpan と Kore は通常、日本語と韓国語のテキストに使用され、Hans と Hant は中国語のテキストに使用されます。特定のスクリプトを識別できない場合は、タグ Zyyy が使用されます。国際化の詳細については、国際化プログラミングのトピックを参照してください。
言語は BCP-47 タグによって一様に記述され、できれば標準的な形式で記述されます。タグ und は、特定の言語を特定できない場合に使用されます。
Google Transalate REST APIを使用するだけで、言語を見つけることができます。
また、RestKitのようなものを使用して、Google サーバーへの REST 要求を行うことができます。
N-gram サンプリング周波数手法を使用できます。私は専門家ではありませんが、実際にはうまく機能すると噂されています。
言語会話を可能にする Google 翻訳 API が利用可能です。文字列に一致した言語を返す何かが見つかるはずです。詳細については、 Google 翻訳 APIを参照してください。