4

チャットボットを拡張しており、入力文から単語の補題を見つけたいと考えています。チャットボットは C++ で作成されており、LemmaGen と呼ばれる無料のオープン ソースの見出し語化ツールを見つけました。C++ のバージョン 2.2 をダウンロードしましたが、参照方法や使用方法に関するドキュメントはありません。

過去に c++ の LemmaGen を使用した経験のある人はいますか? どんな情報も役に立ちます。どうもありがとう

4

1 に答える 1

2

C++ 版は使用しませんでしたが、C# 版を使用しました。C# での LemmaGen の使用は単純で、非常に簡単です。まず、モデル ファイルのパラメーターを使用して Lemmatizer 型のオブジェクトを初期化し、そのパブリック メソッドを呼び出して、文字列として表される単語を Lemmatize することができます。したがって、テキストをトークン化し、各トークンを 1 つずつ見出し語化するだけです。メソッドは、入力単語の見出し語を表す文字列を返します。

C++版の使い方も似ていると思います。

于 2014-08-22T12:43:00.407 に答える