Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
段落に単語マップを作成したい。例えば; 私の文字列は「ゴー パン ジョン、昨日はゴーイング イズ ミュージック ミュージック...」です。単語はその文字列にマップされます: music=2、go=2、bread=1、John=1、yesterday=1。単語の接尾辞は共通語根と見なされます (例 musics=music)。C# でコーディングしているこのトピックはどうですか?
まず語幹ライブラリが必要です。このSO トピックで提案されているSnowballは、開始するのに適した場所のようです。
ステマーを使用しても、小さな記事から非常に大量の単語リストが得られることは間違いないため、これらすべてを追跡するための最善の策は、おそらく SQL データベースです。ただし、これらの値を一時的に追跡する必要があるだけの場合は、単純な文字列テーブルでうまくいくでしょう。