さまざまな固有表現認識 (NER) ライブラリを評価しており、 Polyglotを試しています。
すべてが順調に進んでいるように見えますが、コマンド プロンプトで次の行を使用するよう指示されています。
!polyglot --lang en tokenize --input testdata/cricket.txt | polyglot --lang en ner | tail -n 20
...(例では)次の出力が得られるはずです。
, O
which O
was O
equalled O
five O
days O
ago O
by O
South I-LOC
Africa I-LOC
in O
their O
victory O
over O
West I-ORG
Indies I-ORG
in O
Sydney I-LOC
. O
これはまさに私のプロジェクトに必要な種類の出力であり、私が必要としているのとまったく同じように機能します。ただし、コマンドラインではなく PyCharm インターフェイス内で実行し、結果を pandas データフレームに保存する必要があります。そのコマンドをどのように翻訳しますか?