4

私は自動テキストサマライザーを設計しています。このプロジェクトの主要なモジュールの 1 つはTRAINING CORPUSを必要とします。TRAINING CORPUSを提供するか、リンクを参照してダウンロードしてください。期待して感謝

4

4 に答える 4

5

Norvig によるスペル修正プログラムの作成方法を参照してください。彼は、 Project GutenbergウィクショナリーBritish National CorpusBirkbeck spelling error corpusについて言及しています。ブラウンコーパスもあります。

于 2008-11-12T08:35:38.620 に答える
3

コーパスを含む、いくつかのテキスト要約リソースを次に示します。NLP/コーパス言語リソースのスタンフォード リストも役立つ場合があります。

于 2008-11-12T08:44:26.027 に答える
0

Corpora メーリング リストも参照してください。これらは出発点として適しています。さらに多くのリソースについては、メーリング アーカイブを参照することもできます。

于 2009-02-23T10:27:34.063 に答える
0

British Columbia Conversation Corpus - http://www.cs.ubc.ca/~rjoty/Webpage/resources.htmここ からダウンロードできます。

于 2014-04-16T15:20:31.570 に答える