2

非構造化データから日付/時刻カレンダーイベントを解析できるJavaのライブラリを誰かが提案できますか?例

  • 今夜午後10時から!2月10日日曜日=>2013年2月10日午後10時
  • 明日(2月10日)=>2013年2月10日
  • 2月10日日曜日\r\n2月16日まで毎日上映

等々

入力データはユーザーからのものであるため、ユーザーは任意のランダムな形式でデータを入力できます。私はすべての可能なトークンを識別し始め、すべてのトークンを表現するために正規表現の一致を行いました。誰かがJavaでライブラリを提案できるかどうか疑問に思います。これは、実際に解析に役立つ可能性があります。

私はSOに関する他の投稿に目を通しましたが、彼らはテクニックを示唆しているようです。誰かが図書館を持っているのではないかと思います。

ありがとう

4

2 に答える 2

0

UTAH ( https://github.com/sonalake/utah-parser ) は、構造化されていないテキストの一般的な解析をマップに処理できます。それが完了したら、それをフォーマッタに投入できるはずです。

于 2016-04-01T22:37:05.560 に答える
0

http://opennlp.apache.org/にある Apache openLNP (自然言語処理) からトランク ソースの一部を取得するか、サーバーに openNLP を実装して呼び出し可能な RESTful Web サービスをセットアップするだけです。OOB openNLP を実装する利点は、日付、時刻、組織、場所、および人物の nameFinder インターフェースを介したエンティティ抽出機能があることです。また、関心のあるアイテムの適切なエンティティ タイプを示すより一般的なコンテキストのサンプル ファイルを作成し、それに対して NLP モデルをトレーニングして、コンテキストのヒット率を向上させることもできます。http://www.augmentedintel.com/apps/csharpnlp/extract-names-from-text.aspxのポートフォリオのアプリ セクションに、C# NLP の実例があります。

于 2013-04-26T14:01:23.157 に答える