次のような文字列を分離するチャンク分析を実行しようとしています。
"thequickbrownfoxjumped"
の中へ
"the quick brown fox jumped"
教師なし学習方法を使用します。
投票の専門家のアルゴリズムについて説明しているいくつかの論文、つまりhttp://w3.sista.arizona.edu/~cohen/Publications/papers/voting-experts.pdfに出くわしました。これは、頻度とエントロピーの組み合わせによってこの目標を達成します。メトリック。
Rでアルゴリズムを使用したいのですが、これまでのところJavaバージョンしかないと思います(ここに含まれています:http ://code.google.com/p/voting-experts/ )
a)アルゴリズムの実装を含むRパッケージがあるかどうかb)Rにすでに実装されている同様のアルゴリズムがあるかどうか疑問に思います。