2 つのドキュメントからテキストを読み取って比較することにより、2 つのドキュメント間でテキストがコピーされたかどうかを判断できるアプリケーションを作成したいと考えています。誰かがこれをやろうとしたことがあるかどうか、そして同じことを処理する最善の方法は何かを知りたかった. 機械学習と自然言語処理が関係している場合: どのレベルまで?
質問する
130 次
2 に答える
1
集合論の概念のみに依存する手法があります
良いスタートとしてhttp://en.wikipedia.org/wiki/W-shinglingを試してください。
于 2012-05-12T20:06:29.340 に答える