私は現在、Web ページ内の特定の製品名を検出するために Wapiti を使用しています。モデルをトレーニングしました。このモデルのより重要なルールの上位 10 個をリストしたいと思います (最大の重み (正または負) を持つルール)。
以下は、Wapiti のドキュメントから取得したトレーニング済みモデルの例です。
[...]
12:*:Pre-3 X='s,
13:*:Pre-3 X=Wel,
13:*:Suf-3 X=rid,
[...]
10=-0x1.32892bf985df3p-1
11=0x1.73883325ee8edp-4
15=0x1.034d12a224d71p-2
16=-0x1.1fa154002a2f9p+0
では、上記の 3 つのルールから、どれが最大の重みを持つかをどのように知ることができますか? ルール*:Pre-3 X='s,
は番号「12」に関連付けられています。この数字は体重ですか?それとも以下の行への参照ですか?ただし、番号「12」はこれらの行には表示されません。
別の質問: 「ハード制約」を強制することは可能ですか? つまり、観察が見られるたびに、常に特定のタグを生成するというルールを作成します。