問題タブ [python-crfsuite]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
46 参照

python - 条件付きランダム フィールド モデルを使用して、セキュリティ アドバイザリ データの名前付きエンティティ認識をトレーニングすることはできますか?

私が使用したいデータセットは、Adobe の製品の Security Advisory と Security Bulletins からのものです。Web サイトのリンクhttps://helpx.adobe.com/cy_en/security.html/security/security-bulletin.ug.html。ただし、注釈の部分を行う必要はないと仮定し、固有表現認識を進めることができると思います。これは、抽出したデータがすでに配置されているためです。

私が選択したデータセットは次のとおりです。

これはcsv形式で抽出されたデータセットの例です

公開日 Vulnerability_id CVE_番号 影響を受けるソフトウェア
2008 年 5 月 6 日 APSA08-05 CVE-2008-1201 アフターエフェクト CS3
2019年8月13日 APSB19-31 CVE-2019-8062 アフターエフェクト
- - CVE-2020-3765 アフターエフェクト

私の質問は、Conditional Random Fields モデルを使用して、セキュリティ アドバイザリ データの名前付きエンティティ認識をトレーニングすることは可能ですか? はいの場合、IOB エンコーディングまたはその他の提案を使用して、関連するエンティティを認識するために最適な機能の選択を選択するにはどうすればよいですか?