“classification”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

276 参照

statistics - AI/色の名前を決定するための統計的手法

あらかじめ決められた候補のリストから、（RGB値）の色の名前を推測するための小さなライブラリを作成することを考えています。

私の最初の試みは、純粋に3次元RGB色空間内のピタゴリアン距離に基づいていました-名前の付いた色点のほとんどが空間の端にあったため（たとえば、0、0、255の青）、これは大した成功ではありませんでした。、スペースの中央にあるほとんどの色では、最も近い名前の色もかなり恣意的でした。

だから、私はより良いアプローチを考えていて、いくつかの候補を考え出しました

HSV色空間内の円柱距離-上記と同様の問題が発生する可能性がありますが、HSVは、RGBよりも人間的な意味で意味があるように思われます。これは便利です。
上記のいずれかですが、名前が付けられた各カラーポイントは、周囲の空間内のポイントへの引力の強さを示す任意の値で重み付けされています。そのようなモデルの名前はありますか？これは少し漠然としていると思いますが、私にはかなり直感的なアイデアのようです。
HSV色のプロパティを調べて、最も可能性の高い色名を返すベイジアンネットワーク（たとえば、P（黒|彩度<10）、P（赤|色相= 0）に似たノードを想像していますが、これは理想的とは言えません-たとえば、特定の色が赤になる確率は、離散値ではなく、色相が0にどれだけ近いかに比例します。ベイジアンネットワークを適応させて、テストされている変数？
最後に、HSVまたはRGB色空間内のサポートベクターマシンベースの分類があるかどうか疑問に思っていましたが、これらにあまり精通していないため、これがピタゴラス距離ベースのアプローチよりも特別な利点を提供するかどうかはわかりません。特に私は3次元空間しか扱っていないので、最初に試しました。

したがって、私は疑問に思っていました、あなたの誰かが同様の問題の経験を持っているか、または私がアプローチを決定するのを助けることができるかもしれないリソースを知っていますか？誰かが私を正しい方向に向けることができれば（それが上記のいずれかであろうと、まったく異なるものであろうと）、私は非常に感謝しています。

乾杯！

ティム

2010-08-07T10:21:38.397

0 投票する

3 に答える

6521 参照

matlab - MATLAB のマルチラベル AdaBoost

現在、MATLAB のマルチラベル AdaBoost 実装、またはマルチラベルの場合に 2 ラベル実装を効率的に使用する手法を探しています。その点で何か助けていただければ幸いです。

matlab machine-learning classification adaboost

2010-08-07T18:15:14.680

0 投票する

1 に答える

42059 参照

matlab - 単層ニューラルネットワーク

単層ニューラルネットワークの実装には、2 つのデータファイルがあります。

上記は2つのデータファイルのフォーマットです。

対象の出力は、対応する入力が属する特定のクラスに対して「1」、残りの 2 つの出力に対して「0」です。

問題は次のとおりです。

単層ニューラルネットワークは、Y = A*X + b で A (3 x 2 行列) と b (3 x 1 ベクトル) を見つけます。ここで、Y は [C1, C2, C3]' で、X は [x1, x2]' です。 .

上記の問題をニューラルネットワークで解決するには、方程式を次のように書き直すことができます。 1]'

これで、3 つの入力ノード (それぞれ x1、x2、および 1 に 1 つ) と 3 つの出力 (C1、C2、C3) を持つニューラルネットワークを使用できます。

結果として得られる 9 つの重み (3 つの入力と 3 つの出力の間に 9 つの接続があるため) は、A' 行列の要素に相当します。

基本的に、私はこのようなことをしようとしていますが、うまくいきません:

この関数を別のファイルに記述し、以前のコードで呼び出しています。

matlab artificial-intelligence classification perceptron

2010-08-11T06:02:59.737

0 投票する

5 に答える

8386 参照

machine-learning - 順序分類パッケージとアルゴリズム

アイテムiの評価 (1-5) を選択する分類子を作成しようとしています。各項目 iについて、 iに関する約 40 の異なる量を含むベクトルxがあります。また、各アイテムにゴールドスタンダードの評価を付けています。xのいくつかの関数に基づいて、分類子をトレーニングして、ゴールドスタンダードに厳密に一致する 1 ～ 5 の評価を与えたいと考えています。

私が見たクラシファイアに関する情報のほとんどは、バイナリ決定のみを扱っていますが、私は評価決定を行っています。この種の問題に対処するための一般的な手法やコードライブラリはありますか?

machine-learning classification

2010-08-16T16:25:53.370

0 投票する

1 に答える

806 参照

c# - HTML の解析: アダルト分類システム

私は、Web で使用されている別の (時には時代遅れの) 評価/分類基準を研究しています。すなわち PICS、POWDER、ICRA

最も人気のある標準はどれですか (それを使用しているサイトの数)?

これらのいずれか (またはすべて) を処理する C# ライブラリはありますか?

c#html-parsing classification powder

2010-08-19T01:52:35.710

0 投票する

1 に答える

3032 参照

php - ベイズ分類器の PHP 実装: トピックをテキストに割り当てる

私のニュースページプロジェクトには、次の構造を持つデータベーステーブルnewsがあります。

さらに、単語の頻度に関する情報を含むテーブルベイがあります。

ここで、PHP スクリプトですべてのニュースエントリを分類し、いくつかの可能なカテゴリ (トピック) の 1 つをそれらに割り当てたいと考えています。

これは正しい実装ですか？改善できますか？

トレーニングは手動で行われ、このコードには含まれていません。「不動産を売ればお金を稼ぐことができる」というテキストがカテゴリ/トピック「経済」に割り当てられている場合、すべての単語 (you,can,make,...) が「経済」のテーブルベイに挿入されます。トピックと 1が標準カウントです。単語が同じトピックとの組み合わせで既に存在する場合、カウントがインクリメントされます。

サンプル学習データ:

単語のトピック数

カチンスキー政治 1

ソニーテクノロジー1

銀行経済学1

電話技術 1

ソニー経済学3

エリクソンテクノロジー2

サンプル出力/結果:

テキストのタイトル: 電話テスト Sony Ericsson Aspen - 敏感な Winberry

政治

....電話 ....テスト ....ソニー ....エリクソン ....アスペン ....センシティブ ....ウィンベリー

テクノロジー

....phone FOUND ....test ....sony FOUND ....ericsson FOUND ....aspen ....sensitive ....winberry

経済

....電話 ....test ....sony FOUND ....ericsson ....aspen ....sensitive ....winberry

結果: テキストはトピック Technology に属し、可能性は 0.013888888888889 です。

事前にどうもありがとうございました！

php text bayesian linguistics classification

2010-08-26T13:40:33.867

0 投票する

1 に答える

1068 参照

classification - MOA での weka 分類子の使用

weka で独自の分類器を作成しましたが、weka gui で正常に動作します。weka分類子を選択してから私の分類子を選択して、 MOAで使用しようとしています。私の分類子は、weka 分類子の下の MOA GUI に表示されますが、それを選択すると、「オプションの問題: baseLearner」エラーが発生します。MOA で新しい weka 分類器を使用することはできませんか? MOA に追加する必要がある分類器へのパスまたは参照はありますか?

前もって感謝します

classification weka new-operator moa

2010-09-02T19:26:32.097

0 投票する

11 に答える

3587 参照

artificial-intelligence - オンラインポーカーチートの検出

最近、大規模なポーカーサイトで、発見されたセキュリティの脆弱性を悪用してプレイしているときに、一部のプレーヤーがすべての対戦相手のカードを見ることができる可能性があることが明らかになりました。

ナイーブなチートは信じられないほど速い速度で勝ちます、そしてこれらのチートは通常非常に速く捕らえられます、そして速く捕まえられないならば、彼らは彼らの手の歴史を通して速いスキャンを通して簡単に見つけることができます。

より難しい問題は、詐欺師が知性を示し、呼び出される場所をブラフし、最悪の手でリバーベットをコールするときに発生します。基本的な前提は、他のプレーヤーのカードを見る能力を偽装するために意図的にポットを失うことです。そして彼らはかなり現実的なレートで勝ちます。

与えられた：

何百万もの検証済みの完全な情報ハンド履歴のデータセット
理論上の無制限のコンピュータパワー
オマハやリミットポーカーに関する提案は有益かもしれませんが、ゲームノーリミットホールデムを想定してください。

これらの詐欺師を合理的に正確に分類するにはどうすればよいでしょうか。オリジナルの2+2スレッドはアイデアをアピールし、SOコミュニティにはいくつかの有用な提案があるのではないかと思いました。

これは現在のものであり、誰かが創造的な解決策を見つけた場合に世界を改善するのに実際に適用されるという点でも興味深い問題です。特定された詐欺師が発見されたときに本物のプレーヤーが資金を払い戻す可能性が高いからです。

artificial-intelligence classification poker anti-cheat statistics

2010-09-03T11:19:19.063

0 投票する

1 に答える

8434 参照

machine-learning - 単純ベイズの結果の解釈

分類にNaiveBayes/Simple classifier (Weka)を使い始めましたが、データのトレーニング中に理解しなければならない問題がいくつかあります。私が使用しているデータセットは weather.nominal.arff です。

代替テキスト

オプションからトレーニングテストを使用すると、分類器の結果は次のようになります。

私の最初の質問は、誤って分類されたインスタンスから何を理解する必要がありますか? なぜこのような問題が発生したのでしょうか。どの属性コレクションが正しく分類されていませんか? これを理解する方法はありますか？

第 2 に、10 倍の交差検証を試みると、正しく分類されていない (少ない) インスタンスが得られるのはなぜですか?

結果は次のとおりです。

machine-learning classification weka

2010-09-06T03:54:23.017

0 投票する

2 に答える

856 参照

machine-learning - データのサブセットに対する分類子のパフォーマンス

Weka を使用して一連のラベル付き Web ページで分類を実行し、AUC で分類器のパフォーマンスを測定しています。分類に使用されていない別の 6 レベルの因子があり、因子の各レベルでの分類子のパフォーマンスを知りたいです。

データのサブセットで分類子のパフォーマンスをテストするには、どのような手法または手段を使用する必要がありますか?

machine-learning classification weka

2010-09-08T00:00:31.290

問題タブ [classification]

Reference