8

機械学習のために、「Two-Spiral」、「Cluster-inside-Cluster」、「Half-Kernel」、「crescent-full-moon」、「outlier」などの人工データが必要です。

人工データ

MATLAB にガイド/パッケージ/ソース コードはありますか?

4

1 に答える 1

14

この種のデータセットを利用できると便利で、楽しい演習になると思ったので、写真に示されているものと非常によく似たランダムなデータセットを生成する関数をいくつか書きました。インスタンスの数、ノイズの量などを制御するオプションが多数あります。各関数の出力は Nx3 行列で、各行にはインスタンスの X、Y 座標とクラスが含まれます。

出力は次のようになります。

生成されたデータセットの例

それぞれ 30 ~ 40 行の 6 つのスクリプトでそれを行いました。スクリプトを Matlab File Exchange にアップロードしましたが、まだレビューされていません。今のところ、ファイルはこちらから入手できます。この最初のバージョンにはコメントはほとんどありませんが、コードが一目瞭然であることを願っています。datasetsdemo.mすべてのスクリプトを実行して上記の画像を生成するデモ スクリプト ( ) もあります。

于 2013-04-22T23:35:48.267 に答える