大規模なイベント データに対して特異値分解を実行したいと考えています。300以上の属性があるとしましょう。アトラスの 50% は文字列値です。都市名やその他の可能な文字列値のように。
私の知る限り、SVDは数値間の距離を計算することで次元削減を行います。非常に多くの文字列値がある場合、どうすれば達成できますか?
編集:コメントと私の誤解のために言い直してください。テキスト値に対して次元削減を行う方法を知りたいです。
大規模なイベント データに対して特異値分解を実行したいと考えています。300以上の属性があるとしましょう。アトラスの 50% は文字列値です。都市名やその他の可能な文字列値のように。
私の知る限り、SVDは数値間の距離を計算することで次元削減を行います。非常に多くの文字列値がある場合、どうすれば達成できますか?
編集:コメントと私の誤解のために言い直してください。テキスト値に対して次元削減を行う方法を知りたいです。