問題タブ [classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Javaで決定木を作成するための最良の学習アルゴリズム?
年齢、都市、子供の年齢などの情報と結果(確認、承認)を含むデータセットがあります。
「ワークフロー」のモデル化を支援するために、以前のデータセットに基づいて決定木を自動的に作成したいと思います。
私はhttp://en.wikipedia.org/wiki/Decision_tree_learningを調べましたが、問題が明らかに明らかではないことを知っています。
サンプルに基づいた決定木の構築に役立つ、このテーマに関するいくつかのアルゴリズムまたはいくつかのライブラリについてアドバイスが必要です。
java - Javaでのテキスト分類
次の要件については、Javaで何らかのソリューションが必要です。
- テキストで特定の用語を検索します(各用語は1〜3語にすることができます)。例:{"hello world"、"hello"}。一致は正確である必要があります。
- 約500種類の用語グループがあり、それぞれに約30の用語が含まれています。
- 各テキストには最大4000語を含めることができます。
パフォーマンスは重要な問題です。
ありがとう、ロッド
matlab - ベクトルのベストエフォート分類のアルゴリズム
「クラス」を表す 4 つのバイナリ ベクトルがあるとします。
浮動小数点値のベクトルをこれらの「クラス」の 1 つに分類するために使用できる方法は何ですか?
ほとんどの場合、基本的な丸めは機能します。
しかし、どうすれば干渉を処理できますか?
この 2 番目のケースは 1000000000 に適しているはずですが、明確な一致がないため、ソリューションを完全に失ってしまいました。
このタスクに MATLAB を使用したいと考えています。
algorithm - 潜在意味索引付け(LSI)は統計的分類アルゴリズムですか?
潜在意味索引付け(LSI)は統計的分類アルゴリズムですか?なぜまたはなぜそうではないのですか?
基本的に、統計分類のウィキペディアのページでLSIについて言及されていない理由を理解しようとしています。私はちょうどこのことに取り掛かっていて、何かを分類するためのすべての異なるアプローチが互いにどのように関連しているかを見ようとしています。
c++ - 優れたC++サポートベクターマシン(SVM)ライブラリを知っていますか?
libsvm http://www.csie.ntu.edu.tw/~cjlin/libsvm/を試しましたが、今のところ私は気が狂っていません。
SVMLightとTinySVMについても聞いたことがあります。それらを試しましたか?新しいプレーヤーはいますか?
ありがとう !
python - 共通性に基づいて文字列の配列を分類します
文字列(マルチワード)の膨大なリスト(200000)があります。これらの文字列間の単語一致のコンマ配列に基づいて、これらの文字列をグループ化します。このための低計算時間アルゴリズムは考えられません
" AB500 "
"バスAB500 "
"ニュースCA "
"ニュースCABLAH"
私の計画はでし
た。それらを単語にトークン化します。
b。グローバル配列トークンを作成します
c。それらの文字列を一般的なトークンと比較します。
ご想像のとおり、これは役に立ちません。このためのアルゴリズムを提案できますか?私はこれをPythonで書いています。
machine-learning - 機械学習ツール Weka の使用についての質問
分類には Weka のエクスプローラー機能を使用しています。
したがって、NUMERIC 値の 2 つの機能を持つ .arff ファイルがあり、クラスはバイナリ 0 または 1 ({0,1} など) です。
サンプル:
この .arff ファイルをロードし、10 分割クロス検証 (テスト ファイルなし) を使用し、NaiveBayes を選択してから、データを分類すると、ラベルが正しくない 5 つ、正しくラベル付けされた 100 が得られます。ここまでは順調ですね。
ここで、.arff ファイルを大幅に変更します (フィーチャ属性に完全にランダムな値を指定します)。上記を繰り返すと、分類時にまったく同じ統計が得られます。
.arff ファイルにさらに変更を加えて、さまざまな分類アルゴリズムでこれを試しました。それでも、.arff ファイルにどのような値を指定しても、(同じアルゴリズム内で) まったく同じ統計が得られます。
ここで何か間違ったことをしていますか?
url - JAVAを使用してブラウザのアドレスバーに入力されたURLを読み取る
URLを悪意のあるものと良性のものに分類するJavaアプリケーションを作成したいと思います。つまり、ユーザーがアドレスバーにURLを入力すると、プログラムはそのURLを読み取り、分類して、悪意のある場合はブロックする必要があります。ユーザーが入力したブラウザのアドレスバーからURLを読み取るにはどうすればよいですか。
助けてください..
ありがとう
url - オンライン URL 分類子
次のようなオンライン アプリケーションを作成したいと考えています。
- ブラウザのアドレスバーからURLを読み取ります
- その字句特徴を抽出します (n-gram など)
- ホストベースの機能を抽出します (DNS レコードをオンラインで取得し、その A、PTR、TTL フィールド)
- URL を悪意のあるものと無害なものに分類する (機械学習を使用)
1と3について誰か教えてください。
classification - ソフトウェアの分類基準を知っている人はいますか?
もちろん、私は Google/Bing を試してみて、特定の業界について 1 つまたは 2 つの分類を見つけましたが、一般的なものは何も見つかりませんでした。私が探しているのは、一般的な Office ツール -> ワードプロセッシング -> ワード ユーティリティ -> ファイル管理 -> 圧縮 -> Winzip です。
私が求めているのは、ある組織によって発行された、または多くの異なる関係者が使用している標準です。単一の組織が使用している分類だけではありません。