問題タブ [srl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
arrays - 配列の上位 N 個の要素をグループごとに保持する
Blaze Advisor (ルール エンジン) で独自の言語を使用しています。特定の属性によって形成されたグループによって、上位 N 個のアイテムのみを配列に保持する方法のアルゴリズムを探しています。例として、2 つの配列があります。
そして2番目の配列:
属性で示されるようparrentId
に、child
配列内のそれぞれの上位 3 つの要素のみを保持したいと思います。result
私の言語では、すべての基本的な操作を行うことができます。if/else、while、for、for 各構文を使用して、新しい変数を作成できます。配列の asc/desc を並べ替えて、並べ替えられた要素のインデックスを取得できます。配列の要素を削除できます。
私のデータでは、次の結果が必要です。
jvm - JVM 仮想 RAM を 8 GB に設定する場合、物理 RAM の最小要件は何ですか?
最近、mateplus を自分の仕事にセマンティック ロール ラベル付けツールに統合しようとしています。ヒープ メモリ用に最大 8 GB の JVM 仮想 RAM が必要です。物理 RAM の最小要件を教えてください。
nlp - Python での Senna Semantic Role Labellar
Senna Semantic Role Labellar を使用して、2 つの文の類似性を測定したいと考えています。私はそれについてインターネットで記事を読みましたが、Python で実装して使用することはできませんでした。私は Senna SRL について学んでいるので、Senna SRL に関するいくつかの優れたリソースを、Windows マシン用の Python で最初から高度にすることを提案してください。
文を考えてみてください彼はいい子を知って います セナ srl の後、それは立っています彼[A0] 知っている[v] (いい子)[A1]
allennlp - AllenNLP BERT SRL 入力形式 (「OntoNotes v. 5.0 形式」)
目標は、BERT SRLを別のデータセットでトレーニングすることです。構成に応じて、 が必要conll-formatted-ontonotes-5.0
です。
ネイティブに、私のデータは CoNLL 形式で提供され、それを OntoNotes v.5.0 のGitHub 版のconll-formatted-ontonotes-5.0 形式に変換しました。データの読み取りは機能し、トレーニングは機能しているように見えますが、精度が 0 のままであることを除きます。SRL 引数のエンコード (BOI またはフレーズ?) または列構造 (CoNLL 形式の他の OntoNotes エディションはここで異なります) が予想と異なると思われます。入力。または、ロール ラベルがコードに組み込まれている場合、エラーが発生する可能性があります。長い形式( )を使用して参照データをたどりましたARGM-TMP
が、他のデータでは短い形式(AM-TMP
)をよく見かけます。
問題は、ここで期待されるデータセットと形式です。OntoNotes 5.0 の CoNLL/Skel フォーマットの 1 つに WORD 列が復元されたものだと思いますが、
CoNLL 版はOntoNotes の LDC 版には同梱されていないようです
OntoNotes の作成者が提供するGitHubの OntoNotes v.5.0 の「conll-formatted-ontonotes-5.0」版の形式ではないようです。
PropBank の一部として、 OntoNotes 5.0 データの少なくとも 1 つの他の CoNLL/Skel エディションがあります。これは、3 つの列が省略されていることと、述語のエンコードが他のものと異なります。(私のデータの一部については、これがネイティブ形式です。)
SrlReaderのドキュメントには、BIO (IOBES) エンコーディングが記載されています。これは、PropBank データの他の CoNLL 版で実際に使用されていますが、上記の OntoNotes コーパスでは使用されていません。他のそのような形式は、たとえば、CoNLL-2008 および CoNLL-2009 形式、およびさまざまなバリアントです。
SrlReader のリバース エンジニアリングを開始する前に、それに応じてデータを準備できるデータ スニペットを手元に持っている人はいますか?
conll-formatted-ontonotes-5.0
私のデータのバージョン (EWT コーパスからのサンプル):