問題タブ [classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
22687 参照

c++ - 優れたC++サポートベクターマシン(SVM)ライブラリを知っていますか?

libsvm http://www.csie.ntu.edu.tw/~cjlin/libsvm/を試しましたが、今のところ私は気が狂っていません。

SVMLightTinySVMについても聞いたことがあります。それらを試しましたか?新しいプレーヤーはいますか?

ありがとう !

0 投票する
4 に答える
1213 参照

python - 共通性に基づいて文字列の配列を分類します

文字列(マルチワード)の膨大なリスト(200000)があります。これらの文字列間の単語一致のコンマ配列に基づいて、これらの文字列をグループ化します。このための低計算時間アルゴリズムは考えられません

" AB500 "
"バスAB500 "
"ニュースCA "
"ニュースCABLAH"

私の計画はでし
た。それらを単語にトークン化します。
b。グローバル配列トークンを作成します
c。それらの文字列を一般的なトークンと比較します。

ご想像のとおり、これは役に立ちません。このためのアルゴリズムを提案できますか?私はこれをPythonで書いています。

0 投票する
3 に答える
1827 参照

machine-learning - 機械学習ツール Weka の使用についての質問

分類には Weka のエクスプローラー機能を使用しています。

したがって、NUMERIC 値の 2 つの機能を持つ .arff ファイルがあり、クラスはバイナリ 0 または 1 ({0,1} など) です。

サンプル:

この .arff ファイルをロードし、10 分割クロス検証 (テスト ファイルなし) を使用し、NaiveBayes を選択してから、データを分類すると、ラベルが正しくない 5 つ、正しくラベル付けされた 100 が得られます。ここまでは順調ですね。

ここで、.arff ファイルを大幅に変更します (フィーチャ属性に完全にランダムな値を指定します)。上記を繰り返すと、分類時にまったく同じ統計が得られます。

.arff ファイルにさらに変更を加えて、さまざまな分類アルゴリズムでこれを試しました。それでも、.arff ファイルにどのような値を指定しても、(同じアルゴリズム内で) まったく同じ統計が得られます。

ここで何か間違ったことをしていますか?

0 投票する
1 に答える
1148 参照

url - JAVAを使用してブラウザのアドレスバーに入力されたURLを読み取る

URLを悪意のあるものと良性のものに分類するJavaアプリケーションを作成したいと思います。つまり、ユーザーがアドレスバーにURLを入力すると、プログラムはそのURLを読み取り、分類して、悪意のある場合はブロックする必要があります。ユーザーが入力したブラウザのアドレスバーからURLを読み取るにはどうすればよいですか。

助けてください..

ありがとう

0 投票する
2 に答える
419 参照

url - オンライン URL 分類子

次のようなオンライン アプリケーションを作成したいと考えています。

  1. ブラウザのアドレスバーからURLを読み取ります
  2. その字句特徴を抽出します (n-gram など)
  3. ホストベースの機能を抽出します (DNS レコードをオンラインで取得し、その A、PTR、TTL フィールド)
  4. URL を悪意のあるものと無害なものに分類する (機械学習を使用)

1と3について誰か教えてください。

0 投票する
6 に答える
1070 参照

classification - ソフトウェアの分類基準を知っている人はいますか?

もちろん、私は Google/Bing を試してみて、特定の業界について 1 つまたは 2 つの分類を見つけましたが、一般的なものは何も見つかりませんでした。私が探しているのは、一般的な Office ツール -> ワードプロセッシング -> ワード ユーティリティ -> ファイル管理 -> 圧縮 -> Winzip です。

私が求めているのは、ある組織によって発行された、または多くの異なる関係者が使用している標準です。単一の組織が使用している分類だけではありません。

0 投票する
9 に答える
2428 参照

php - 画像分類 - フロア プランの検出

私は不動産のウェブサイトに取り組んでおり、画像がフロア プランであるか会社のロゴであるかを把握 (分類) できるプログラムを書きたいと考えています。

私はphpで書いているので、phpソリューションを好みますが、c ++またはopencvソリューションも問題ありません。

フロアプランのサンプル:

代替テキスト http://www.rentingtime.com/uploads/listing/l0050/0000050930/68614.jpg

代替テキスト http://www.rentingtime.com/uploads/listing/l0031/0000031701/44199.jpg

ロゴのサンプル:

代替テキスト http://www.rentingtime.com/uploads/listing/l0091/0000091285/95205.jpg

0 投票する
2 に答える
261 参照

ruby - Ruby、FeedNormalizerの使用がClassifier::CRM114を壊す理由

Rubyを学んだだけで、奇妙なことがわかりました(少なくとも、ansi-cプログラマーにとっては)。

Mac OS X 10.6.2、ruby 1.8.7(2008-08-11パッチレベル72)[universal-darwin10.0]、feed-normalizer 1.5.1、crm114 1.0.3

上記のファイルの実行:

いいでしょう、これはただのデモです。

行のコメントを解除します#FeedNormalizer...

そしてコメントなしでファイルを実行します:

?!ここで何が起こっているのですか?FeedNormalizerの使用がcrm114を壊すのはなぜですか(これらは関連していません)?この種の状況をデバッグする方法は?これは、他のクラスが他のクラスを壊すのが一般的ですか?再起動もしました(これはMacです;))

0 投票する
1 に答える
3107 参照

classification - Adaboost アルゴリズムと顔検出におけるその使用法

Adaboost アルゴリズムを理解しようとしていますが、いくつか問題があります。Adaboost について読んだ後、それが分類アルゴリズム (ニューラル ネットワークのようなもの) であることに気付きました。しかし、弱分類器がどのように選択されているか (顔検出のための haar のような機能だと思います)、最終的な強分類器である H 結果を最終的にどのように使用できるかを知ることができませんでした。つまり、アルファ値を見つけて H を計算した場合、それを新しい画像の値 (1 または 0) としてどのように活用できるでしょうか。完璧な方法でそれを説明する例はありますか? ほとんどのadaboostチュートリアルにあるプラスとマイナスの例を見つけましたが、hiがどのように正確に選択され、顔検出に同じ概念を採用するかがわかりませんでした. 私は多くの論文を読み、多くのアイデアを持っていましたが、今まで私のアイデアはうまく整理されていませんでした. ありがとう....

0 投票する
4 に答える
7350 参照

classification - 音楽フィンガープリントはどのように機能しますか(ShazamやLala.comなどのサイトの場合)?

私の大規模な(120GB)音楽コレクションには多くの重複曲が含まれており、重複を検出することを期待してトラックのフィンガープリントを作成しようとしています。そして、私はCS専攻なので、そこで何が行われているのか非常に興味がありますか?ShazamやLala.comのようなものほど正確なものはありません。彼らはどのようにトラックを「ハッシュ」しますか?すべてのファイル(26,000ファイル)で標準のMD5ハッシュを実行しましたが、異なるトラックで何百もの等しいハッシュが見つかったため、機能しません。

Lala.comは、Shazamとは異なり、完全なファイルで動作するため、より興味がありますが、どちらも同様の手法を使用していると思います。音楽の一意の識別子を生成する方法を誰かが説明できますか?