ローマ字表記された名前が日本語の名前である可能性が高いかどうかを判断するにはどうすればよいですか?
"Yukihiro Matsumoto".likely_to_be_japanese? # => true
"John Smith".likely_to_be_japanese? # => false
理想的には、自由形式のテキストも入力して、テキストに日本語である可能性が高い名前があるか、日本語である可能性が低い名前があるか、名前が含まれていないかを検出したいと考えています。できれば偽陽性を無視します。
"call Koichi on (02) 5550 5555".has_japanese_name_in_it? # => true
"call John on (02) 5550 5556".has_non_japanese_name_in_it? # => true
"utility bill to be shared equally".has_non_japanese_name_in_it? => false
できればRubyで、これを行うのに役立つライブラリはありますか? それとも、日本語と日本語以外の名前のコーパスを見つけて、独自のソリューションを構築する必要がありますか?