4

NLTK Named Entity Taggerを使用して、さまざまな名前付きエンティティを識別しようとしています。Pythonを使用した自然言語処理の本では、一般的に使用される名前付きエンティティのリストを提供しています(表7.4、興味がある場合は表7.4)。これはNLTKの名前付きエンティティタガーで実行できるという印象を受けました。

ただし、タガーを実行した場合、人や組織のように、日付や時刻をまったく取得していないようです。NLTK名前付きエンティティタガーはこれらの日付/時刻のケースを処理しませんか、それとも特定の日付/時刻形式のみを取得しますか?これらのケースを処理しない場合、誰かが処理するシステムを知っていますか?それとも、私自身の唯一の解決策を作成していますか?

ありがとう!

4

1 に答える 1

10

NLTKのcontribリポジトリをチェックアウトする必要があります-timex.pyというモジュールが含まれているか、ここからダウンロードします: https ://github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py

モジュールの最初の行から:

#テキスト内の時間的表現にタグを付けるためのコード
于 2012-04-27T02:12:22.680 に答える