私はpylabで散布図をまとめようとしていますが、これまでのところ惨めに失敗しています。私はプログラマーではないので、ご容赦ください。
約 6 万行の csv ファイルに含まれる 2 列のデータで構成されるデータ セットがあります。サンプルは次のとおりです。
100000000012640,0.888888888888889
100000000105442,0.777777777777778
100000000206866,1.0
100000000304930,0.777777777777778
100000000583236,0.888888888888889
100000000683528,0.777777777777778
718435316,1.0
718494043,0.777777777777778
718602951,0.777777777777778
718660499,0.777777777777778
718766852,1.0
718795104,1.0
718862926,0.777777777777778
718927526,0.777777777777778
718952836,1.0
719102865,0.777777777777778
719156726,1.0
719213511,1.0
719425334,1.0
719452158,1.0
719493947,0.777777777777778
719566609,1.0
720090346,0.777777777777778
720127760,0.777777777777778
720143948,0.944444444444444
720221566,1.0
720256688,0.944444444444444
720349817,0.777777777777778
720380601,0.777777777777778
720446322,1.0
720524740,1.0
720560353,1.0
720594066,0.777777777777778
720673388,1.0
720716865,0.777777777777778
720730249,1.0
720774433,1.0
私の目標は、このデータの散布図を描くことです。最初の行のデータを x 軸に、2 番目の行のデータを y 軸にします。x 軸の値は降順で並べ替えられ、示されている値から始まり、999963505 で終わります。y 軸の値は常に 0 から 1 の間です。
これが私が試したことです(「ipython --pylab」を使用):
data = loadtxt('./data/OD-4322/facebookID.csv', unpack=True, dtype=('float', 'float'), delimiter=',')
scatter(data[0],data[1])
これにより、散布図に似たものが得られますが、探しているものとはまったく異なります。
(私は画像を直接投稿しますが、サイトでの私の評判ではまだ許可されていません)。
x 軸が値と同じ範囲になるようにするにはどうすればよいですか? プロットのポイントがすべて 0 と 1 に積み上げられているのはなぜですか?実際には 0 と 1 の間のあちこちに分布しています