文内の三項関係、そして最終的には文間の関係を捉えようとしています。
例: 2015 年と 2016 年の純収益は、それぞれ 200 万ドルと 300 万ドルでした。
期待される出力:(net revenues,$2.0 million,2015),(net revenues,$3.0 million,2016)
2段階のプロセスとしてこれにアプローチする
- bi-lstm Attention network を使用して二項関係を抽出すると、この出力は次のようになります。
(net revenues,$2.0 million),(net revenues,$3.0 million),(net revenues,2016),(net revenues,2015)
- ラベルが存在する場合、エンティティの位置番号とこれらのエンティティ間のエッジを使用して関係グラフを作成しようとしています。このグラフからクリークを生成して、三項関係を作成します。
lines=["8 10 ","8 18","8 22 ","8 28","8 31","12 37"]
g1=nx.parse_edgelist(lines,nodetype=int)
for ab in nx.clique.find_cliques(g1):
print(ab)
関係グラフを作成せずに、エッジをリストとして渡し、クリークが見つかるかどうかを確認したかったのですが、出力は入力と同じです。このアプローチまたはそれ以外についてアドバイスが必要です。