5,000以上の属性を含むデータセットがあります テーブルは以下のようになります
id attr1 attr2, attr3
a 0 1 0
a 1 0 0
a 0 0 0
a 0 0 1
クラスタリングによるデータマイニングに適したものにするために、たとえば下の表のように、各レコードを 1 つの行に表示したいと考えています。
id, attr1, attr2, attr3
a 1 1 1
私はこれを行う多くの方法を試しました.MYSQL DBにインポートして、各属性の最大値を取得しようとしました(IDごとに1または0のみにすることができます)が、テーブルは5,000以上の属性を保持できません.
Excel でピボット関数を使用して属性ごとの最大値を取得しようとしましたが、ピボットが処理できる列の数は、現在見ている 5,000 よりもはるかに少ないです。
私はそれをTableuaにインポートしようとしましたが、あまりにも多くのレコードを処理できないという事実にも苦しんでいます
テキスト/CSVファイルまたはデータベーステーブルのいずれかで表2を取得したいだけです
ソフトウェアの一部、または私がまだ検討していないものなど、誰かが何か提案できますか