0

まず、私はデータの前処理が非常に苦手です。libsvm 形式の WebKB データを探していました。後でインターネットでたくさん検索した後、ステミングとストップワードの削除後に得られたこのデータに出くわしました。形式は次のとおりです。
各行はベクトルを表し、各ファイルの最初の単語にはクラス名が含まれ、その後にスペースで区切られた機能を形成する単語のリストが続きます。
このようなテキスト ファイルを lib-svm 形式に変換するにはどうすればよいですか? それを構築するためのWekaまたはMatlabツールはありますか?

4

1 に答える 1