1

ローマ字表記された名前が日本語の名前である可能性が高いかどうかを判断するにはどうすればよいですか?

"Yukihiro Matsumoto".likely_to_be_japanese? # => true
"John Smith".likely_to_be_japanese? # => false

理想的には、自由形式のテキストも入力して、テキストに日本語である可能性が高い名前があるか、日本語である可能性が低い名前があるか、名前が含まれていないかを検出したいと考えています。できれば偽陽性を無視します。

"call Koichi on (02) 5550 5555".has_japanese_name_in_it? # => true
"call John on (02) 5550 5556".has_non_japanese_name_in_it? # => true
"utility bill to be shared equally".has_non_japanese_name_in_it? => false

できればRubyで、これを行うのに役立つライブラリはありますか? それとも、日本語と日本語以外の名前のコーパスを見つけて、独自のソリューションを構築する必要がありますか?

4

2 に答える 2

1

Google翻訳などを使用できます。まつもとを英語から日本語に翻訳すると、日本語なので、2つの漢字の結果(松+本)が得られます.

于 2012-07-11T04:28:38.173 に答える