0

イベント (コンサート、映画など) のデータを Ruby で解析しようとしていますが、どのツールを使用すればよいかわかりません。

最初はスタンフォード パーサーが適していると思っていましたが、ツリートップについて聞いたことがあります。

スタンフォードパーサーをRuby on Windowsで動作させるには、2日以上の検索と苦労が必要であり、インストールするだけでエラーが後を絶たないため、私は両方に苦労しています。

Treetop は問題なくインストールされましたが、ドキュメントは非常に限られており、収集できる限り、treetop は実際のコンテンツよりも文法構造を扱うのに最適であるように見えますが、Treetop の機能を完全に理解していないだけかもしれません。

良いことの 1 つは (私が思うに)、バンド名と映画名の大規模なデータベース/コーパス (?) と、取得しようとしているデータのかなり限定された部分があることです。

たとえば、1 つのリストは

The Tragically Hip with Guest Hey Rosetta!、7 月 15 日金曜日、午後 7 時 30 分、ディア レイク パーク

別のリストは

2011 年 7 月 8 日 - タコマ ドーム、New Kids on the Block & Backstreet Boys w/ Matthew Morrison、午後 7 時 30 分、ワシントン州タコマ

各リストで、誰/何、日付、時間、都市、会場など、かなり具体的な詳細のグループを取得しようとしています.

私はすでにバンド名のデータセットを持っており、都市名のリストを取得するのはかなり簡単なはずなので、他の詳細を選択するのは「かなり」簡単なはずですが、どのツールを専用にするべきかわかりませんまたは、これを行うためのより良い方法がある場合は?

助言がありますか?

4

1 に答える 1

2

いいえ、treetopより構造化された言語 (コンピューター言語など) を解析するために使用されます。自然言語解析 (NLP) の場合は、スタンフォード パーサーなどを使用することをお勧めします。NLP と Ruby の組み合わせについては、次のブログ エントリをご覧ください。

http://mendicantbug.com/2009/09/13/nlp-resources-for-ruby/

于 2011-07-10T21:52:08.487 に答える