0

以下のように、NERエンジンからの出力をデータフレームに挿入したいと思います

ID
1
2

上記のようにデータフレームを読み取って ID を取得し、それを使用してパスから読み取ります。データフレームで loc として使用する dfindex 変数を作成しようとしましたが、上書きし続けます

dfner = pd.DataFrame()
dfindex = 0
for index, row in dfl.iterrows():
    id = row['id']
    
    path = "C:\\Users\\myfolder\\"+str(row['chart'])+".txt"
    with open(path,"r") as myfile:
       target_string = myfile.read()
       print(id)
       #here i do the NER
       doc = nlp(target_string)
       for ent in doc.ents:
           print(ent.text,ent.label_)
           dfner.loc[dfindex,'id'] = str(id)
           dfner.[dfindex,'match'] = ent.label_
           dfindex+=1

出力:

1

ジョン・ネーム

雌犬の名前

2

クリスの名前

クラーク名

これを以下のようにデータフレームに保存したいと思います

ID マッチ
1 ジョン
1
2 クリス
2 クラーク
4

1 に答える 1

0

私はそれを理解したかもしれません。エントリの数をカウントするために空のリストを使用しました。以下はコードです

dfner.loc[len(listname)-1, 'match'] = ent.label_
dfner.loc[len(listname)-1, 'id'] = str(id)
于 2021-08-27T20:46:39.810 に答える