Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
全体的なタスクは、ウィキペディアのページで NLP を行うことです。
まずはダウンロードしたウィキペディアのデータベースダンプ(40GBのXMLファイル)にGATEからいい感じでアクセスするか。実際には、医療カテゴリだけが必要です。
これにはいくつかのライブラリがありますか?
ヒントをいただければ幸いです。
帯域幅
私が検索した限りでは、次のことを行う必要があるようです。1.Mediawikiをローカルにインストールする2.mwdumpを使用してxmlダンプをMediawikiデータベース(MySQL)にインポートする3.JDBCコネクタを使用してMySQLデータベースにアクセスする
私が迂回しているかどうかわからない