多くの数値を含む疎行列 .txt ファイルがありますが、ほとんどは 0 です。この .txt ファイルのサンプルを次に示します。
0 0 0.271178 0 0 0 0.538776 0 -0.631228 0 0 -0.501485 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.438643 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.498918 0 0 0 0 0 0 0 0.475561 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.370479 0 -0.300765 0 -1.10987 0 0 0.163637 0 0 0 0 0 0 0 0 0 0 0.304006 0 0.181697 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.261758 0 0 0 0.153415 0.17412 0 -0.129725 0 0.17598 0 0 0 0 0 0 0 0 6 0 0 5 0.5 -0.211302 0 0 0 0 0 0 0.213277 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0698458 0 0 0 0.661972 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.376654 0 0 -0.604655 0 0 0 0 0 0 0 0 0.301025 0 0 -0.431324 0 0 -0.139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0.315063 0 0 -0.285598 0 0 0.206607 0139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 7 0 8 2 8139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 7 0 8 2 8
私がしなければならないことは、このファイルを調べて、データをWEKA の 認識可能なファイル形式である .arff に変換できるようにすることです。これにより、データ セットに対してデータ マイニング アルゴリズムを実行できるようになります。誰もこれを行う方法を知っていますか? 私の問題に似た StackOverflow でいくつかの同様の質問を見つけましたが、それらは AWK 言語のスクリプトを使用しており、以前に .awk プログラムを使用したことがないため、それらのプログラムを正しく実行できませんでした。これらの投稿へのリンクは次のとおりです: 1 2