以下のように、NERエンジンからの出力をデータフレームに挿入したいと思います
ID |
---|
1 |
2 |
上記のようにデータフレームを読み取って ID を取得し、それを使用してパスから読み取ります。データフレームで loc として使用する dfindex 変数を作成しようとしましたが、上書きし続けます
dfner = pd.DataFrame()
dfindex = 0
for index, row in dfl.iterrows():
id = row['id']
path = "C:\\Users\\myfolder\\"+str(row['chart'])+".txt"
with open(path,"r") as myfile:
target_string = myfile.read()
print(id)
#here i do the NER
doc = nlp(target_string)
for ent in doc.ents:
print(ent.text,ent.label_)
dfner.loc[dfindex,'id'] = str(id)
dfner.[dfindex,'match'] = ent.label_
dfindex+=1
出力:
1
ジョン・ネーム
雌犬の名前
2
クリスの名前
クラーク名
これを以下のようにデータフレームに保存したいと思います
ID | マッチ |
---|---|
1 | ジョン |
1 | 雌 |
2 | クリス |
2 | クラーク |