1

私は、機械学習、パターン認識、データ マイニングなど、およびそれらの基礎となる理論とシステムについてあまり経験がありません。

与えられた数独パズルで人間が動くのにかかる時間の人工モデルを開発したいと思います。

したがって、機械学習プロセスの出力として私が探しているのは、対象の人間が特定の数独の状況で行動を起こすのにかかる時間を予測できるモデルです。

同じ入力が常に同じ結果にマップされるとは限りません。人間が同じ状況で行動するのにかかる時間は異なりますが、私の仮説は、結果として得られる確率分布に傾向があるということです。(私の知識に基づいた推測では、それは ~ 正常です。)

分布に影響を与える要因 (#empty スロットなど) についてのアイデアはありますが、これらのパターンを把握するためにシステムに任せることが望ましいです。私はパターンには興味がなく、モデルだけに興味があることに注意してください。

数独パズルを実行し、移動にかかる時間を測定することで、サンプル データとテスト データを簡単に生成できます。

これにはどのような学習アルゴリズムを使用することをお勧めしますか?

私はNNを考えていましたが、同じ入力に対して重み付けされたランダムな結果を与えるという望ましい特性を持つことができるかどうかはわかりません。

4

3 に答える 3

1

私がこれを正しく理解している場合、長さ 81 の入力ベクトルがあり、正方形が塗りつぶされている場合は 1、それ以外の場合は 0 が含まれます。そのボード位置に対する人間の応答時間をモデル化する確率分布を返す関数を学習したいと考えています。

私の最初の回答は、これは回帰の問題であり、単純な線形回帰を試す必要があるということです。これは、応答時間の分布を提供するのではなく、単一の「最善の推測」応答時間を提供します。

応答時間の分布をモデル化する理由がよくわかりません。ただし、本当に分布を出力したい場合は、ベイジアン法を見たいようです。私はベイジアン推論の専門家ではないので、ここでこれ以上お手伝いすることはできません。

ただし、空のスロットの数が重要であるなどの機能についてのあなたの直感に同意するので、あなたのアプローチがうまくいくとは本当に思いません。行/列ごとの空のスロットの数など、重要である可能性が高い他の明らかな機能もあります。これらの機能を表現に明示的に配置することは、学習アルゴリズムが独自に同様のものを推測することを期待するよりも、おそらくはるかに成功するでしょう.

于 2009-11-28T11:20:52.417 に答える
0

モンテカルロ法はここではうまく機能するように見えますが、実際にそれを行うには月の大きさのソリューションのスタックが必要です. 1 人あたりの時間ではなく、平均的な時間です。

それについての私の理解は、それ自体は希薄ですが、ボードの位置と人間が次の動きをするのにかかった時間のデータベースがあるということです。少なくとも、ほとんどの動きの開始点があります。データベースにない場合でも、何らかのアルゴリズムに基づいて移動にかかる時間を計算し始めることができます。機械学習でこれを行うように指定したことは知っていますが、問題を少し小さなものに分割してから構築する価値があるかもしれません.

于 2009-11-27T19:13:47.143 に答える
0

関数に影響を与えるもの (空のセルの数など) について推測できる場合は、81 個のセルのベクトル (0/1 または 0..9 ではありません) ではなく、features のベクトルで分類器をトレーニングしてみてください。私の議論にとっては本当に重要です)。

あなたの主張は次のとおりだと思います:

根底にあるパターンを知る必要はありません。学習システムの「訓練されたパターン」は、非常に繊細で微妙なパターンを内部に自動的にエンコードします。これは、その大きな力の 1 つです。

間違っている。ネットワークに正しいドメインを与える必要がありますたとえば、画像内のオブジェクトを検出しようとする場合、ピクセル ドメインで作業しても意味がありません。エッジやコーナーなどを検出するために最初にいくつかの機能検出を実行した場合にのみ結果が得られます。理論的には、十分な非線形性 (NN で - ネットワーク内の十分な層) があれば、そのようなものを検出できますが、実際には、私は持っています分類器に適切な機能を提供することなく、その作業を見たことはありません。

私はNNを考えていましたが、同じ入力に対して重み付けされたランダムな結果を与えるという望ましい特性を持つことができるかどうかはわかりません。

2 ^ 81または10 ^ 81(または私が提案するはるかに小さい特徴空間)からR(0とInfの間の応答時間)またはその離散化への関数を学習しようとしているだけです。したがって、NN やその他の分類器はそれを行うことができます。

于 2009-12-30T09:38:47.670 に答える