1

全体的なタスクは、ウィキペディアのページで NLP を行うことです。

まずはダウンロードしたウィキペディアのデータベースダンプ(40GBのXMLファイル)にGATEからいい感じでアクセスするか。実際には、医療カテゴリだけが必要です。

これにはいくつかのライブラリがありますか?

ヒントをいただければ幸いです。

帯域幅

4

1 に答える 1

0

私が検索した限りでは、次のことを行う必要があるようです。1.Mediawikiをローカルにインストールする2.mwdumpを使用してxmlダンプをMediawikiデータベース(MySQL)にインポートする3.JDBCコネクタを使用してMySQLデータベースにアクセスする

私が迂回しているかどうかわからない

于 2012-10-13T07:59:21.247 に答える