私は自動テキストサマライザーを設計しています。このプロジェクトの主要なモジュールの 1 つはTRAINING CORPUSを必要とします。TRAINING CORPUSを提供するか、リンクを参照してダウンロードしてください。期待して感謝
質問する
4539 次
4 に答える
5
Norvig によるスペル修正プログラムの作成方法を参照してください。彼は、 Project Gutenberg、ウィクショナリー、British National Corpus、Birkbeck spelling error corpusについて言及しています。ブラウンコーパスもあります。
于 2008-11-12T08:35:38.620 に答える
3
コーパスを含む、いくつかのテキスト要約リソースを次に示します。NLP/コーパス言語リソースのスタンフォード リストも役立つ場合があります。
于 2008-11-12T08:44:26.027 に答える
0
Corpora メーリング リストも参照してください。これらは出発点として適しています。さらに多くのリソースについては、メーリング アーカイブを参照することもできます。
于 2009-02-23T10:27:34.063 に答える
0
British Columbia Conversation Corpus - http://www.cs.ubc.ca/~rjoty/Webpage/resources.htmここ からダウンロードできます。
于 2014-04-16T15:20:31.570 に答える