これは教師あり学習の問題です。
有向非巡回グラフ (DAG) があります。各エッジには特徴 X のベクトルがあり、各ノード (頂点) にはラベル 0 または 1 があります。タスクは、コスト関数 w(X) を見つけて、任意のノード ペア間の最短パスの比率が最大になるようにすることです。 1 ~ 0 (最小分類誤差)。
ソリューションは適切に一般化する必要があります。ロジスティック回帰を試してみたところ、学習したロジスティック関数は、着信エッジの特徴を示すノードのラベルをかなりよく予測します。ただし、グラフのトポロジはそのアプローチでは考慮されないため、グラフ全体の解は最適ではありません。言い換えれば、ロジスティック関数は、上記の問題設定では適切な重み関数ではありません。
私の問題設定は典型的な二項分類の問題設定ではありませんが、ここに良い入門があります: http://en.wikipedia.org/wiki/Supervised_learning#How_supervised_learning_algorithms_work
詳細は次のとおりです。
- 各特徴ベクトル X は、実数の d 次元リストです。
- 各エッジには特徴のベクトルがあります。つまり、エッジのセット E = {e1, e2, .. en} と特徴ベクトルのセット F = {X1, X2 ... Xn} が与えられると、エッジ ei はベクトル Xi に関連付けられます。
- 関数 f(X) を考え出すことができるので、f(Xi) は、エッジ ei が 1 でラベル付けされたノードを指している可能性を示します。そのような関数の例は、私が上で述べたもので、ロジスティックによって見つけられます。回帰。しかし、上で述べたように、そのような機能は最適ではありません。
問題は次のとおりです: グラフ、開始ノード、終了ノードが与えられた場合、最適なコスト関数 w(X) をどのように学習すれば、ノード 1 と 0 の比率が最大化されますか (最小分類誤差)?