6

私は、特定の問題に対する賛否両論をグラフィカルに表現することで、ユーザーが議論を理解できるようにするサイトを構築しています。(ラングル)

これらの議論を分類して、より簡単に見つけて接続できるようにしたいと思います。議論の作成者が利益を得る前にタグやカテゴリを追加するよう求めて、議論を作成する人をいらいらさせたくないので、キーワードを自動的に抽出する方法を検討しています。

討論のタイトルと説明 (および場合によっては議論自体の内容) を取得して、類似の討論を結び付けるためのメタデータとして使用できる 10 個の強力なキーワードを抽出するための良いアプローチ討論が表示される HTML ページの先頭にある「メタ」キーワード タグのコンテンツ。例えば。データマッパーとアクティブレコード

このサイトは、データ ストレージに DataMapper を使用して、Sinatra を使用して Ruby でコーディングされています。私は理想的には、Heroku で動作するものを探しています (動的にファイルをディスクに書き込む方法がありません)。Web サービス、API、または理想的には Ruby gem を検討します。

4

3 に答える 3

7

多分あなたはTextAnalyzerを使うことができます。

于 2011-03-16T08:04:45.353 に答える
2

キーワードを自動的に抽出し、討論を分類するsalsaAPIを試すことができます。

于 2011-03-16T15:46:37.893 に答える
2

あなたがこれを達成する簡単な方法を見つけたいと思っていることは理解しています.私は最近、NLP(自然言語処理)とテキストマイニングの世界に飛び込みました.

私はPHPでそれを行いましたが、あなたが探しているものに似たいくつかの機能をコーディングすることができました. プロジェクト(Wrangl)に合わせて調整したい場合は、自分で行うことをお勧めします。

Rubyコードがあると確信して いるPorterステミングアルゴリズムを使用します。Ruby Porter ステマー

于 2011-03-16T13:01:42.420 に答える