ユーザーが提供するテキスト ブロックの入力言語を検出するためのライブラリまたは手法を探しています。オフラインで実行する必要があるアプリを作成しているため、このタスクではオンライン検索 (Google 翻訳など) は機能しません。
ありがとう。
ユーザーが提供するテキスト ブロックの入力言語を検出するためのライブラリまたは手法を探しています。オフラインで実行する必要があるアプリを作成しているため、このタスクではオンライン検索 (Google 翻訳など) は機能しません。
ありがとう。
試してみたいn-gramベースの gem をさらに 2 つ紹介します。彼らはオフラインで作業します。
興味のある方のために、http://rubygems.org/gems/kenwaln-whatlanguageを見つけました。これは優れたパフォーマンスを発揮しています。
Ruby での WhatLanguage の簡単なデモ:
http://www.youtube.com/watch?v=lNqZ2cqOReo&list=UUJ_3fstMOH-g4yBxtvgAWkw&index=0&feature=plcp