optimization - アイデア/参考文献/キーワードの検索: 検索アルゴリズムの適応パラメータ制御 (オンライン学習)

Question

組み合わせ最適化における検索アルゴリズムのパラメータの適応パラメータ制御 (オンライン学習)に関するアイデア/経験/参考文献/キーワードを探しています。

もう少し詳しく：

私は、難しい組み合わせ最適化問題の最適化を担当するフレームワークを持っています。これは、反復的に使用されるいくつかの「小さなヒューリスティック」の助けを借りて行われます (大規模な近隣検索、破棄して再作成するアプローチ)。これらの「小さなヒューリスティック」のすべてのアルゴリズムは、ヒューリスティックロジックをある程度制御しているいくつかの外部パラメーターを使用しています (現時点では、ランダムな値のみ; ある種のノイズ; 検索を多様化します)。

ここで、これらのパラメーターを収束を改善する方法で、可能な限り一般的に選択するための制御フレームワークが必要です。これにより、パラメーター制御を変更せずに新しいヒューリスティックを後で追加できるようになります。

少なくとも 2 つの一般的な決定事項があります。

A: 次の反復で使用されるアルゴリズムのペア (1 つの破棄アルゴリズムと 1 つの再構築アルゴリズム) を選択します。
B: アルゴリズムのランダムパラメータを選択します。

唯一のフィードバックは、新しく見つかったソリューションの評価関数です。それが強化学習の話題につながります。それは正しい方向ですか？

実際には学習のような行動ではありませんが、現時点での単純化されたアイデアは次のとおりです。

A: 反復中に収集されたパフォーマンス値に応じたルーレットホイールの選択 (近い過去は古いものよりも価値があります)。したがって、ヒューリスティック 1 がすべての新しいグローバルベストソリューションを見つけた場合 -> これを選択する可能性が高くなります。
B: まだわかりません。おそらく、(0,1) の範囲でいくつかの不均一なランダム値を使用することが可能であり、私は変化の勢いを集めています。したがって、ヒューリスティック 1 が前回 alpha = 0.3 を使用し、新しい最適解が見つからなかった場合、0.6 を使用して新しい最適解が見つかった場合 -> 1 に向かう勢いがある -> 次のランダム値は 0.3 よりも大きくなる可能性があります。考えられる問題:発振!

注意すべきこと: - 1 つの特定のアルゴリズムの良好な収束に必要なパラメーターは劇的に変化する可能性があります。- 特定の破壊/再構築アルゴリズムのペア (結合近傍と呼ばれることもある) には、相乗効果が期待できる可能性があります。そのようなものをどのように認識しますか？それはまだ強化学習エリアにあるのですか？- さまざまなアルゴリズムは、さまざまな数のパラメーターによって制御されます (1 つを取るものもあれば、3 つを取るものもあります)。

アイデア、経験、参考文献 (論文)、キーワード (ML トピック) はありますか?
(b) の決定について、オフライン学習の方法でアイデアがあれば。それについて言及することを躊躇しないでください。

ご意見ありがとうございます。

サーシャ

score 1 · Accepted Answer

これは、あなたがやろうとしているハイパーヒューリスティックのように聞こえます。そのキーワードを探してみてください。

Drools Planner (オープンソース、Java)では、タブー検索とシミュレートされたアニーリングをすぐにサポートしています。私は（まだ）台無しにして再作成するアプローチを実装していませんが、より良い結果は期待していませんが、それは簡単なはずです。挑戦: 私が間違っていることを証明し、それをフォークして追加し、例で私を打ち負かしてください。ハイパーヒューリスティックは私の TODO リストにあります。

score 1 · Accepted Answer

アルゴリズムのセットを制御するために使用するパラメーター変数のセットがあります。アルゴリズムの選択は、単なる別の変数です。

検討したいアプローチの 1 つは、遺伝的アルゴリズムを使用して「パラメーター空間」を進化させることです。要するに、GA は自然選択のプロセスの類似物を使用して、より良い解決策を次々と生み出します。

パラメーター空間を文字列として表すエンコードスキームを開発し、開始世代として多数の候補解を作成する必要があります。遺伝的アルゴリズム自体は、セット内で最も適したソリューションを取得し、それらにさまざまな遺伝的演算子 (突然変異、繁殖など) を適用して、次世代となるより良いセットを繁殖させます。

このプロセスの最も難しい部分は、適切なフィットネス関数を開発することです。これは、特定のパラメーター空間の品質を定量的に測定するものです。検索の問題は複雑すぎて母集団内の各候補を測定できない可能性があるため、理想的なソリューション自体と同じくらい開発が難しいプロキシモデル関数が必要になります。

あなたが書いたことをもっと理解しないと、このアプローチが実行可能かどうかを判断するのは困難です。GA は通常、このような多変数最適化問題に適していますが、特効薬ではありません。参考までにウィキペディアから。

optimization - アイデア/参考文献/キーワードの検索: 検索アルゴリズムの適応パラメータ制御 (オンライン学習)

2 に答える 2

Related

Reference