名前がラテン語以外の文字(言語Arabic, Hebrew, Chinese, Japanese
など)で書かれているとします。
同じ名前のと をsearch engine
一致させるにはどうすればよいでしょうか。およびその逆?original name
English spelling
拓海
日本語での名前とEnglish
スペルのようなものTakumi
。
algorithm/technique
これを行うために使用されるものは何ですか?
名前がラテン語以外の文字(言語Arabic, Hebrew, Chinese, Japanese
など)で書かれているとします。
同じ名前のと をsearch engine
一致させるにはどうすればよいでしょうか。およびその逆?original name
English spelling
拓海
日本語での名前とEnglish
スペルのようなものTakumi
。
algorithm/technique
これを行うために使用されるものは何ですか?
良い一日。
次のことを行う必要があります。
世界の各言語を同じ記号で分類します。
all langs:
最後に、任意の言語の記号のつづりの間に規則があります。たとえば、ヒンディー語、中国語など、一部の言語にはルールがありません。独自のルールを作成する必要があります(この言語の転写に基づいて)。
algo:
[w][e][п] = wep
えー
e - eng r - rus 転写[п] = p
検索エンジン (Google など) には、おそらく膨大な量のデータ セット (コーパス) があり、各コーパスは異なる言語で書かれています。
ある言語の単語を別の言語に翻訳したい場合、第一言語のコーパスで単語を検索し、第二言語のコーパスで適合する単語を返すことで翻訳できます。(名前についても同じ手法)
それが基本的な考え方です。
背景については、こちらの NLP フィールドについてお読みください: http://en.wikipedia.org/wiki/Natural_language_processing