大規模なデータセットで次元削減法(ここで説明:ランダム射影アルゴリズムの擬似コード)を使用しました。
ディメンションを1000から50に減らした後、各サンプルが次のようになる新しいデータセットを取得します。
[1751。-360。-2069。...、2694。-3295。-1764。]
負の特徴値が何を意味するのかわからないので、今は少し混乱しています。このようなネガティブな機能があっても大丈夫ですか?削減前は、各サンプルは次のようでした。
3、18、18、18、126..。
それは正常ですか、それとも私は何か間違ったことをしていますか?