0

Drools はステミングや POS タグ付けのルールを書くのに適していますか? より良いルール言語の提案を歓迎します。ルールベースのアプローチを使用するこの分野の多くの論文を読みましたが、ルールを記述するために使用されたライブラリまたはフレームワークについて言及したものはありませんでした。

私のルールは次のようなものです。

if (length = 3 & first_letter in group1 and second_letter in group2) then ...
if (length = 3 & first_letter in group1 and second_letter not_in group2) then ...
if (length = 3 & first_letter not_in group1 and second_letter in group2) then ...
if (length = 3 & first_letter not_in group1 and second_letter not_in group2) then ...
if (length = 4...

... 等々。

問題は、これらのルールが多すぎて処理できないことです。10 個の文字グループがあり、各グループに属する各文字にケースがあると想像してください。単語を正しく分類するためのルールは簡単に 1,000 を超えます。これらのルールのうち 30 個を単純な C# コードで記述しましたが、これだけで、このアプローチがいかに非効率的であるかを理解できました。私はすでにルールを紙の上にツリーとして整理しています。それらを挿入、表現、微調整、テストするための適切なフレームワークが必要なだけです。

私の質問が明確であることを願っています。ありがとうございました。

4

1 に答える 1

1

確かに Drools を使用できます。Drools は、汗をかかずに、上で提示したものよりもはるかに複雑な、何千ものルール (30k 以上のルールを持つ kbase を見たことがあります) を処理できます。

私が目にする主な問題はランタイムではなく、ルールのメンテナンスです。ユースケースのために、手動で行うのは大変な作業のようです。どの言語/エンジンを選択してもかまいません。デシジョン テーブルを使用してルールを定義すると、通常は「入力」が少なくて済むのではないでしょうか。または、スクリプトにすべてのルールを生成させることができますか? Drools は両方をサポートします。

于 2012-06-12T16:13:19.217 に答える