私は、データセット間で同様のパターンが現れる頻度と近さを報告できるアルゴリズムを開発しようとしています。
簡単な例:
set1 = [0, 1, 0, 0, 2, 0, 0, 3, 0]
set2 = [1, 2, 3, 0, 0, 0, 0, 0, 0]
set3 = [0, 0, 0, 0, 0, 1, 2, 0, 3]
これらの各セットには1、2、および3がありますが、これらの番号はset2とset3で近接しています。
リスト内包表記でこのタスクを実行できると思います。データを変数xとyに描画し、各一致をリストのリストにカタログ化できます。ここで、埋め込まれたリストの1つの1番目の要素は見つかった一致の文字列であり、2番目と3番目の要素はそれらの位置です。そして、このリストを別の関数で実行して、それらの一致が発生する頻度と近さを計算し、パーセンテージを報告することができます。
それとも、これを行うためのよりエレガントな方法がありますか?
私はまだHaskellの初心者です。何かアドバイスをいただければ幸いです。