command-line - PyCharm でこの Polyglot トークン/タグ抽出プログラムを実行するにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/60213501 2020-02-13T17:30:54.023

111 次

さまざまな固有表現認識 (NER) ライブラリを評価しており、 Polyglotを試しています。

すべてが順調に進んでいるように見えますが、コマンドプロンプトで次の行を使用するよう指示されています。

!polyglot --lang en tokenize --input testdata/cricket.txt |  polyglot --lang en ner | tail -n 20

...（例では）次の出力が得られるはずです。

,               O
which           O
was             O
equalled        O
five            O
days            O
ago             O
by              O
South           I-LOC
Africa          I-LOC
in              O
their           O
victory         O
over            O
West            I-ORG
Indies          I-ORG
in              O
Sydney          I-LOC
.               O

これはまさに私のプロジェクトに必要な種類の出力であり、私が必要としているのとまったく同じように機能します。ただし、コマンドラインではなく PyCharm インターフェイス内で実行し、結果を pandas データフレームに保存する必要があります。そのコマンドをどのように翻訳しますか?

command-line - PyCharm でこの Polyglot トークン/タグ抽出プログラムを実行するにはどうすればよいですか?

1 に答える 1

Related

Reference