0

私はPythonでかなり新しいです。

nltk.cluster パッケージを使用して、単純な kMeans を単語ドキュメント マトリックスに適用しようとしています。マトリックスがnumpy配列のようなオブジェクトのリストである場合は機能しますが、スパースマトリックス表現(csc_matrix、csr_matrix、lil_matrixなど)では機能しませんでした。

私が見つけたすべての情報は次のとおりです。

ベクトルは numpy 配列のようなオブジェクトを使用する必要があることに注意してください。nltk_contrib.unimelb.tacohn.SparseArrays は、必要に応じて効率化のために使用できます

これが何を意味するのかわかりません。誰でもこの問題で私を助けることができますか?

前もって感謝します!

4

1 に答える 1

1

これは、入力ベクトルを渡すときに、numpy.array()またはnltk_contrib.unimelb.tacohn.SparseArraysのいずれかを渡すことができることを意味します。

パッケージnltk_contrib.unimelb.tacohnを調べて、SparseArraysクラスを見つけることをお勧めします。次に、このクラスを使用してデータを作成してから、nltk.clusterに渡します。

于 2011-02-22T23:53:07.113 に答える