3

名前がラテン語以外の文字(言語Arabic, Hebrew, Chinese, Japaneseなど)で書かれているとします。

同じ名前のと をsearch engine一致させるにはどうすればよいでしょうか。およびその逆?original nameEnglish spelling

拓海日本語での名前とEnglishスペルのようなものTakumi

algorithm/techniqueこれを行うために使用されるものは何ですか?

4

2 に答える 2

2

良い一日。

次のことを行う必要があります。

世界の各言語を同じ記号で分類します。

all langs:

  • 英語[26 文字] a bcd e fg ...
  • ロシア語 [33 文字] a бвгде ....
  • 中国語【×文字】……
  • ウクライナ語 [x 文字] a б в г д ..... i
  • 日本語【×文字】…
  • ...................

最後に、任意の言語の記号のつづりの間に規則があります。たとえば、ヒンディー語、中国語など、一部の言語にはルールがありません。独自のルールを作成する必要があります(この言語の転写に基づいて)。

algo:

[w][e][п] = wep

えー

e - eng r - rus 転写[п] = p

于 2012-07-05T13:23:40.217 に答える
0

検索エンジン (Google など) には、おそらく膨大な量のデータ セット (コーパス) があり、各コーパスは異なる言語で書かれています。

ある言語の単語を別の言語に翻訳したい場合、第一言語のコーパスで単語を検索し、第二言語のコーパスで適合する単語を返すことで翻訳できます。(名前についても同じ手法)

それが基本的な考え方です。

背景については、こちらの NLP フィールドについてお読みください: http://en.wikipedia.org/wiki/Natural_language_processing

于 2012-07-05T13:14:11.123 に答える