1

私は自分のCSVファイルを次のようにインポートしています:

records = FasterCSV.read(path, :headers => true, :header_converters => :symbol)

データの一意の発生を取得するにはどうすればよいですか? たとえば、ここにいくつかのサンプルデータがあります:

ID,Timestamp
test,2008.12.03.20.26.32
test,2008.12.03.20.26.38
test,2008.12.03.20.26.41
test,2008.12.03.20.26.42
test,2008.12.03.20.26.43
test,2008.12.03.20.26.44
cnn,2008.12.03.20.30.37
cnn,2008.12.03.20.30.49

単純に を呼び出すとrecords[:id]、次のようになります。

testtesttesttesttesttestcnncnn

私はこれを取得したいと思います:

testcnn

これどうやってするの?

4

1 に答える 1

2

データが大量でない場合はSetクラスを使用できます。

次に例を示します。

p ['cnn','test','test','test','test','cnn','cnn'].to_set.to_a
=> ["cnn", "test"]

簡単なベンチマークは次のとおりです。

require 'set'
require 'benchmark'

Benchmark.bm(5) do |x|
  x.report("Set")   do
    a = []
    20_000.times do |i|
      a << 'cnn'<< 'test'
    end
    a.to_set.to_a
  end
end

=>
           user     system      total        real

Set    0.110000   0.000000   0.110000 (  0.109000)
于 2009-01-09T20:52:47.627 に答える