1

こんにちは、

さて、マルチラベル テキスト分類を実行したいので、このタスクを実行するために MEKA (Weka の拡張) を選択します。ただし、ドキュメントを単語のベクトルに変換する必要があります。GUI の Weka を使用しますが、ご存じのように、2 値分類のみを実行します。そのため、このタスクを実行するために MEKA を使用する傾向があります。問題は、arff を作成する方法です。ここに複数のラベルを持つファイルは例です: これはテキストです

テトラデカナールの存在下、2A°C でビブリオ ハーベイルシフェラーゼに FMNH(2) を添加すると、生物発光のスペクトル分布と区別できないスペクトル分布を持つ高度に蛍光性の一時的な種が形成されます。生物発光は 1.5 秒で最大強度に達し、10(-1) s(-1)、7 x 10(-3)S(-1) の指数成分で複雑に減衰します。および 7 x10(4)s(-1)。

ラベルは次のとおりです。

「FM」、「Fl」、「Ki」、「Luc」、「Lum」、「Time Factors」

私が取得したい結果:

@attribute L-class {リュック、ラム、リム、...}

@attribute F クラス {FM, Fl, Foot,...}

@attribute o-class{Ki, TimeFactors, Adult, Aged, ...}

@attribute All_words 頻度

@データ

FM,Fl,Ki,Luc,Lum,TimeFactors,2,4,6,8,8,7,4,0,1,2,2....

頭字語はラベルで、数字はテキストに出現する各用語の頻度です。誰かが私を助けることができました、私は本当に感謝しています.

4

0 に答える 0