wekaでは、arff ファイルを読み込みます。視覚化タブを使用して、属性間の関係を表示できます。
しかし、ジッタースライダーの意味がわかりません。その目的は何ですか?
wekaでは、arff ファイルを読み込みます。視覚化タブを使用して、属性間の関係を表示できます。
しかし、ジッタースライダーの意味がわかりません。その目的は何ですか?
メーリングリストのアーカイブで答えを見つけることができます:
Visualize パネルのジッター機能は、プロットされたポイントの座標に人為的なランダム ノイズを追加して、データを少し広げます (他のポイントによって隠されている可能性のあるポイントを確認できるようにするため)。
詳しいことはわかりませんが、一般的にジッターとは、ある基準間隔に対する周期信号の変動を表す用語です。スライダーを使用すると、データポイントが規則的であると見なされる範囲またはしきい値を設定したり、出力を変更して変動を導入したりできると思います。ウィキペディアのエントリは、背景を説明します。
更新:この pdfから、ジッタースライダーはこの目的のためのものです:
公称属性を処理するための「ジッター」オプション (および「隠れた」データ ポイントを検出するため)
添付のスライドに基づくと、おそらく 2 つのデータ ポイントが重なるときに表示するために、視覚化にいくつかのバリエーションが導入されているように見えます。
更新 2: このGoogle ブックスの抜粋(Ian H. Witten、Eibe Frank による Data mining へ) は、私の推測を裏付けているようです:
[ジッター] は、X 値と Y 値に適用されるランダムな変位で、互いに重なっているポイントを分離します。ジッターがなければ、同じデータ ポイントにある 1000 個のインスタンスは 1 個のインスタンスとまったく同じに見えます。
あなたが言及した製品はわかりませんが、一般的にジッタリングとは、サンプル位置をランダム化することを意味します。たとえば、レイ トレーシングでは、通常、画面上の各ピクセルを通過するレイをレンダリングします。ジッタリングは、通常のエイリアシングによって引き起こされる問題を軽減するために、各レイにランダムなオフセットを追加します。