頻度パラメータなどを使ってテキストから重要な文を抽出する効果的な方法を知っていますか?それは「ステミング」(同様の文も検索)も実行できますか?
ソフトウェアの実装もあるのかな?
どうもありがとう
頻度パラメータなどを使ってテキストから重要な文を抽出する効果的な方法を知っていますか?それは「ステミング」(同様の文も検索)も実行できますか?
ソフトウェアの実装もあるのかな?
どうもありがとう
文の識別と抽出を行う優れた自然言語処理(NLP)ツールキットはたくさんあります。
リストについては、 http://en.wikipedia.org/wiki/Natural_language_processing_toolkitsを参照してください。
「類似した文」の要件を明確にする必要があります。文が解析されて比較されるツリーバンク( http://en.wikipedia.org/wiki/Treebank )を探しているかもしれません。
これは、テキストからキーフレーズを抽出することに関するPeterTurneyの論文のリストです。これがテキスト要約リソースのリストです。ステミングとテキストの類似性は異なり、大きく、進化している研究分野です。具体的な答えを得るには、もっと焦点を絞った質問をする必要があります。