助けが必要です!ばかげてすみません。私はPythonを初めて使用するので、この例を試してみたいと思います。
しかし、ラベル付けは手動で行われたため、それぞれ1000ツイートの2つの.txtファイル(posとneg)がある場合は大変な作業になります。
上記の例を使用して、テキストファイルでどのように使用できますか?
私が正しく理解していれば、テキストファイルをPythonオブジェクトに読み込む方法を理解する必要があります。
1行に1つのツイートがあるポジティブサンプルとネガティブサンプル(pos.txt
および)を含む2つのテキストファイルがあるとします。neg.txt
train_samples = {}
with file('pos.txt', 'rt') as f:
for line in f.readlines():
train_samples[line] = 'pos'
ネガティブなツイートに対して上記のループを繰り返すと、の入力が完了しますtrain_samples
。
numpyパッケージからgenfromtxt関数を探す必要があります:http://docs.scipy.org/doc/numpy/user/basics.io.genfromtxt.html
適切なパラメータ(区切り文字、改行文字、...)を指定すると、行列が返されます。