問題タブ [python-crfsuite]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 条件付きランダム フィールド モデルを使用して、セキュリティ アドバイザリ データの名前付きエンティティ認識をトレーニングすることはできますか?
私が使用したいデータセットは、Adobe の製品の Security Advisory と Security Bulletins からのものです。Web サイトのリンクhttps://helpx.adobe.com/cy_en/security.html/security/security-bulletin.ug.html。ただし、注釈の部分を行う必要はないと仮定し、固有表現認識を進めることができると思います。これは、抽出したデータがすでに配置されているためです。
私が選択したデータセットは次のとおりです。
これはcsv形式で抽出されたデータセットの例です
公開日 | Vulnerability_id | CVE_番号 | 影響を受けるソフトウェア |
---|---|---|---|
2008 年 5 月 6 日 | APSA08-05 | CVE-2008-1201 | アフターエフェクト CS3 |
2019年8月13日 | APSB19-31 | CVE-2019-8062 | アフターエフェクト |
- | - | CVE-2020-3765 | アフターエフェクト |
私の質問は、Conditional Random Fields モデルを使用して、セキュリティ アドバイザリ データの名前付きエンティティ認識をトレーニングすることは可能ですか? はいの場合、IOB エンコーディングまたはその他の提案を使用して、関連するエンティティを認識するために最適な機能の選択を選択するにはどうすればよいですか?