私はPythonでかなり新しいです。
nltk.cluster パッケージを使用して、単純な kMeans を単語ドキュメント マトリックスに適用しようとしています。マトリックスがnumpy配列のようなオブジェクトのリストである場合は機能しますが、スパースマトリックス表現(csc_matrix、csr_matrix、lil_matrixなど)では機能しませんでした。
私が見つけたすべての情報は次のとおりです。
ベクトルは numpy 配列のようなオブジェクトを使用する必要があることに注意してください。nltk_contrib.unimelb.tacohn.SparseArrays は、必要に応じて効率化のために使用できます
これが何を意味するのかわかりません。誰でもこの問題で私を助けることができますか?
前もって感謝します!