Stanford Topic Modeling Toolbox (TMT) を使用して Topic Modeling [0] を試しています。私はScalaの初心者です。ただし、CSV ファイルを読み取ってデータ セットを準備できないようです。これが私のコードです
import scalanlp.io._;
val source = CSVFile("pubmed-oa-subset.csv") ~> IDColumn(1);
println(source.data.size);
これにより、次のエラーがスローされます
Stanford TMT\example-0-test.scala:6: error: not found: value IDColumn
val source = CSVFile("pubmed-oa-subset.csv") ~> IDColumn(1);
同様に、Tokenizer などの他のデータ前処理関数でもエラーが発生します。これがコードです
// Stanford TMT Example 0 - Basic data loading
// http://nlp.stanford.edu/software/tmt/0.4/
import scalanlp.io._;
val source = CSVFile("pubmed-oa-subset.csv") ;
println(source.data.size);
val tokenizer = {
SimpleEnglishTokenizer()
}
上記のコードで受け取ったエラーは次のとおりです。
error: not found: value SimpleEnglishTokenizer
SimpleEnglishTokenizer()
TMT ホームページ [1] にあるのと同じ CSV ファイルを使用しています。また、スクリプトとデータは同じフォルダーにあります。
どうした?TMT ホームページからまったく同じテスト例を実行できません。
[0] http://nlp.stanford.edu/software/tmt/tmt-0.4/
[1] http://nlp.stanford.edu/software/tmt/tmt-0.4/examples/pubmed-oa-subset.csv