word_i
wordsと weightsを含む巨大なデータセットがありますweight[i,j]
。ここで、 weight は単語間の「接続強度」です。
このデータを 2 値化したいのですが、単語のコード間のハミング距離がこの重みと相関するように、各単語のバイナリ コードを作成する既存のアルゴリズムがあるかどうかを知りたいです。
追加:
私が取り組んでいる問題は、ニューラル ネットワークまたは SVM に単語間の関連付けを教えたいということです。そのため、データを 2 値化することにしました。マルコフモデルやグラフだけを使用したくない理由は聞かないでください。それらを試して、ニューラルネットと比較したい.
そう、
与えられた単語「a」の NN が、最も近い関連性または設定された単語とその確率を返すようにします。
二値化して「ab」を入力として、重みを優先回答として作成しようとしましたが、これはうまく機能しませんでした。
(重みの)しきい値をもう 1 ビット変更することを考えていました。このしきい値が小さいほど、より多くのビットが必要になります。
私は状況を持っています: a->b w1; b->a w2; w1>>w2 なので、方向が重要です。