問題タブ [classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
statistics - AI/色の名前を決定するための統計的手法
あらかじめ決められた候補のリストから、(RGB値)の色の名前を推測するための小さなライブラリを作成することを考えています。
私の最初の試みは、純粋に3次元RGB色空間内のピタゴリアン距離に基づいていました-名前の付いた色点のほとんどが空間の端にあったため(たとえば、0、0、255の青)、これは大した成功ではありませんでした。 、スペースの中央にあるほとんどの色では、最も近い名前の色もかなり恣意的でした。
だから、私はより良いアプローチを考えていて、いくつかの候補を考え出しました
HSV色空間内の円柱距離-上記と同様の問題が発生する可能性がありますが、HSVは、RGBよりも人間的な意味で意味があるように思われます。これは便利です。
上記のいずれかですが、名前が付けられた各カラーポイントは、周囲の空間内のポイントへの引力の強さを示す任意の値で重み付けされています。そのようなモデルの名前はありますか?これは少し漠然としていると思いますが、私にはかなり直感的なアイデアのようです。
HSV色のプロパティを調べて、最も可能性の高い色名を返すベイジアンネットワーク(たとえば、P(黒|彩度<10)、P(赤|色相= 0)に似たノードを想像していますが、これは理想的とは言えません-たとえば、特定の色が赤になる確率は、離散値ではなく、色相が0にどれだけ近いかに比例します。ベイジアンネットワークを適応させて、テストされている変数?
最後に、HSVまたはRGB色空間内のサポートベクターマシンベースの分類があるかどうか疑問に思っていましたが、これらにあまり精通していないため、これがピタゴラス距離ベースのアプローチよりも特別な利点を提供するかどうかはわかりません。特に私は3次元空間しか扱っていないので、最初に試しました。
したがって、私は疑問に思っていました、あなたの誰かが同様の問題の経験を持っているか、または私がアプローチを決定するのを助けることができるかもしれないリソースを知っていますか?誰かが私を正しい方向に向けることができれば(それが上記のいずれかであろうと、まったく異なるものであろうと)、私は非常に感謝しています。
乾杯!
ティム
matlab - MATLAB のマルチラベル AdaBoost
現在、MATLAB のマルチラベル AdaBoost 実装、またはマルチラベルの場合に 2 ラベル実装を効率的に使用する手法を探しています。その点で何か助けていただければ幸いです。
matlab - 単層ニューラル ネットワーク
単層ニューラル ネットワークの実装には、2 つのデータ ファイルがあります。
上記は2つのデータファイルのフォーマットです。
対象の出力は、対応する入力が属する特定のクラスに対して「1」、残りの 2 つの出力に対して「0」です。
問題は次のとおりです。
単層ニューラル ネットワークは、Y = A*X + b で A (3 x 2 行列) と b (3 x 1 ベクトル) を見つけます。ここで、Y は [C1, C2, C3]' で、X は [x1, x2]' です。 .
上記の問題をニューラル ネットワークで解決するには、方程式を次のように書き直すことができます。 1]'
これで、3 つの入力ノード (それぞれ x1、x2、および 1 に 1 つ) と 3 つの出力 (C1、C2、C3) を持つニューラル ネットワークを使用できます。
結果として得られる 9 つの重み (3 つの入力と 3 つの出力の間に 9 つの接続があるため) は、A' 行列の要素に相当します。
基本的に、私はこのようなことをしようとしていますが、うまくいきません:
この関数を別のファイルに記述し、以前のコードで呼び出しています。
machine-learning - 順序分類パッケージとアルゴリズム
アイテムiの評価 (1-5) を選択する分類子を作成しようとしています。各項目 iについて、 iに関する約 40 の異なる量を含むベクトルxがあります。また、各アイテムにゴールド スタンダードの評価を付けています。xのいくつかの関数に基づいて、分類子をトレーニングして、ゴールド スタンダードに厳密に一致する 1 ~ 5 の評価を与えたいと考えています。
私が見たクラシファイアに関する情報のほとんどは、バイナリ決定のみを扱っていますが、私は評価決定を行っています。この種の問題に対処するための一般的な手法やコード ライブラリはありますか?
php - ベイズ分類器の PHP 実装: トピックをテキストに割り当てる
私のニュース ページ プロジェクトには、次の構造を持つデータベース テーブルnewsがあります。
さらに、単語の頻度に関する情報を含むテーブルベイがあります。
ここで、PHP スクリプトですべてのニュース エントリを分類し、いくつかの可能なカテゴリ (トピック) の 1 つをそれらに割り当てたいと考えています。
これは正しい実装ですか?改善できますか?
トレーニングは手動で行われ、このコードには含まれていません。「不動産を売ればお金を稼ぐことができる」というテキストがカテゴリ/トピック「経済」に割り当てられている場合、すべての単語 (you,can,make,...) が「経済」のテーブルベイに挿入されます。トピックと 1が標準カウントです。単語が同じトピックとの組み合わせで既に存在する場合、カウントがインクリメントされます。
サンプル学習データ:
単語のトピック数
カチンスキー 政治 1
ソニーテクノロジー1
銀行経済学1
電話技術 1
ソニー経済学3
エリクソンテクノロジー2
サンプル出力/結果:
テキストのタイトル: 電話テスト Sony Ericsson Aspen - 敏感な Winberry
政治
....電話 ....テスト ....ソニー ....エリクソン ....アスペン ....センシティブ ....ウィンベリー
テクノロジー
....phone FOUND ....test ....sony FOUND ....ericsson FOUND ....aspen ....sensitive ....winberry
経済
....電話 ....test ....sony FOUND ....ericsson ....aspen ....sensitive ....winberry
結果: テキストはトピック Technology に属し、可能性は 0.013888888888889 です。
事前にどうもありがとうございました!
classification - MOA での weka 分類子の使用
weka で独自の分類器を作成しましたが、weka gui で正常に動作します。weka分類子を選択してから私の分類子を選択して、 MOAで使用しようとしています。私の分類子は、weka 分類子の下の MOA GUI に表示されますが、それを選択すると、「オプションの問題: baseLearner」エラーが発生します。MOA で新しい weka 分類器を使用することはできませんか? MOA に追加する必要がある分類器へのパスまたは参照はありますか?
前もって感謝します
artificial-intelligence - オンラインポーカーチートの検出
最近、大規模なポーカーサイトで、発見されたセキュリティの脆弱性を悪用してプレイしているときに、一部のプレーヤーがすべての対戦相手のカードを見ることができる可能性があることが明らかになりました。
ナイーブなチートは信じられないほど速い速度で勝ちます、そしてこれらのチートは通常非常に速く捕らえられます、そして速く捕まえられないならば、彼らは彼らの手の歴史を通して速いスキャンを通して簡単に見つけることができます。
より難しい問題は、詐欺師が知性を示し、呼び出される場所をブラフし、最悪の手でリバーベットをコールするときに発生します。基本的な前提は、他のプレーヤーのカードを見る能力を偽装するために意図的にポットを失うことです。そして彼らはかなり現実的なレートで勝ちます。
与えられた:
- 何百万もの検証済みの完全な情報ハンド履歴のデータセット
- 理論上の無制限のコンピュータパワー
- オマハやリミットポーカーに関する提案は有益かもしれませんが、ゲームノーリミットホールデムを想定してください。
これらの詐欺師を合理的に正確に分類するにはどうすればよいでしょうか。オリジナルの2+2スレッドはアイデアをアピールし、SOコミュニティにはいくつかの有用な提案があるのではないかと思いました。
これは現在のものであり、誰かが創造的な解決策を見つけた場合に世界を改善するのに実際に適用されるという点でも興味深い問題です。特定された詐欺師が発見されたときに本物のプレーヤーが資金を払い戻す可能性が高いからです。
machine-learning - 単純ベイズの結果の解釈
分類にNaiveBayes/Simple classifier (Weka)を使い始めましたが、データのトレーニング中に理解しなければならない問題がいくつかあります。私が使用しているデータ セットは weather.nominal.arff です。
オプションからトレーニング テストを使用すると、分類器の結果は次のようになります。
私の最初の質問は、誤って分類されたインスタンスから何を理解する必要がありますか? なぜこのような問題が発生したのでしょうか。どの属性コレクションが正しく分類されていませんか? これを理解する方法はありますか?
第 2 に、10 倍の交差検証を試みると、正しく分類されていない (少ない) インスタンスが得られるのはなぜですか?
結果は次のとおりです。
machine-learning - データのサブセットに対する分類子のパフォーマンス
Weka を使用して一連のラベル付き Web ページで分類を実行し、AUC で分類器のパフォーマンスを測定しています。分類に使用されていない別の 6 レベルの因子があり、因子の各レベルでの分類子のパフォーマンスを知りたいです。
データのサブセットで分類子のパフォーマンスをテストするには、どのような手法または手段を使用する必要がありますか?