0

さまざまな固有表現認識 (NER) ライブラリを評価しており、 Polyglotを試しています。

すべてが順調に進んでいるように見えますが、コマンド プロンプトで次の行を使用するよう指示されています。

!polyglot --lang en tokenize --input testdata/cricket.txt |  polyglot --lang en ner | tail -n 20

...(例では)次の出力が得られるはずです。

,               O
which           O
was             O
equalled        O
five            O
days            O
ago             O
by              O
South           I-LOC
Africa          I-LOC
in              O
their           O
victory         O
over            O
West            I-ORG
Indies          I-ORG
in              O
Sydney          I-LOC
.               O

これはまさに私のプロジェクトに必要な種類の出力であり、私が必要としているのとまったく同じように機能します。ただし、コマンドラインではなく PyCharm インターフェイス内で実行し、結果を pandas データフレームに保存する必要があります。そのコマンドをどのように翻訳しますか?

4

1 に答える 1