問題タブ [supervised-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 与えられたデータ サンプルの適切な学習テクニックは何ですか
私はmatlabで働いています。
時間ステップで2 つの無関係な変数のデータ サンプルがあり256
ます。Y 軸に値、X 軸に時間ステップを示したプロットは以下のとおりです。最初の変数の典型的なプロットは次のとおりPos
です
2 番目の変数の典型的なプロットは次のようになりますVel
。
10
次に、次の時間ステップでこれらの変数の値を予測する必要があります。そうするためのさまざまな機械学習手法をチェックするために、最初の時間ステップで変数の値を取得246
し、次の時間ステップを予測してから10
、平均二乗誤差を計算して実際の値と比較しましたms_error
。
を使用してこれを行いtime-series(NAR) ,linear regression,fuzzy input systems,neural networks
ました。しかし、これらのどれも2未満の値を与えることはできms_error
ません.誰かがこれら2つのようなデータサンプルの将来の値を予測するために使用する学習アルゴリズムを提案できますか.
xml - データセットが完全にコーディングされていない場合に、CAT から R にデータをエクスポートする方法は?
CAT から R にデータをエクスポートする方法について、Solomon Messing のチュートリアル (以下のリンクを参照) を使用して大成功を収めました。しかし、3/4 のコーダーだけがデータセットのコーディングを完了すると、問題が発生します。すべてのコーダーによってコーディングされていないドキュメントを削除しても、R は XML ファイルを解析できないようです。私の推測では、CAT からの XML ファイルは最初の数のドキュメントとコーダー用に設定されているため、ドキュメントとコーダーが削除されると、R スクリプトは互換性がなくなります。XML ファイルを変更したり、特定のコーダーによるコーディングを削除したりする方法はありますか? コンソール出力は次のようになります。
doc <- xmlInternalTreeParse(doc, asText=T)
xmlParseCharRef: 無効な xmlChar 値 0
xmlParseCharRef: 無効な xmlChar 値 0
xmlParseCharRef: 無効な xmlChar 値 0
xmlParseCharRef: 無効な xmlChar 値 0
エラー: 1: xmlParseCharRef: 無効な xmlChar 値 0
2: xmlParseCharRef: 無効な xmlChar 値 0
3: xmlParseCharRef: 無効な xmlChar 値 0
4: xmlParseCharRef: 無効な xmlChar 値 0
5: xmlParseCharRef: 無効な xmlChar 値 0
6: xmlParseCharRef: 無効な xmlChar 値 0
http://solomonmessing.wordpress.com/2013/02/04/cat-r-for-content-analysislabels-for-text-mining/
r - Rで決定木ルールをカウントする方法
RPart を使用して決定木を作成しました。問題なく、私はこれをやっています。しかし、ツリーが分割された回数を知る (またはカウントする) 必要がありますか? つまり、ツリーにはいくつのルール (if-else ステートメント) があるのでしょうか? 例えば:
3つのルールがあります。
要約(モデル)を書くとき:
概要(model_dt)
誰かがそれを理解するのを手伝ってくれたら、私は感謝します
敬具 Eray
machine-learning - ニューラル ネットワークとベイジアン ネットワークの効率を比較する
タイトルのように、ANN とベイジアンのどちらが分類または検出と認識の問題で優れているか教えてもらえますか? レーダー追跡システムでは、ターゲットには速度、方向、高さ...どれを適用できますか? 画像処理システムでは、どれが適用できますか?
matlab - KNN を使用して MATLAB でデータを分類する方法は?
K-NN 分類が MATLAB でどのように機能するかを理解するのに問題があります。問題は次のとおりです。大規模なデータセット (1500 を超える被験者に対して 65 の特徴) と、それぞれのクラスのラベル (0 または 1) があります。私に説明されたことによると、データをトレーニング、テスト、および検証のサブセットに分割して、データに対して教師付きトレーニングを実行し、K-NN を介して分類する必要があります。まず、3 つのサブグループを分割する最適な比率はどれくらいですか (それぞれのデータセットのサイズの 1/3 ですか?)。
ClassificationKNN/fitcknn 関数と crossval 関数 (理想的にはデータを分割するため) を調べましたが、それらの使用方法が本当にわかりません。
要約すると、私が望んでいた-データを3つのグループに分割-トレーニングサブセットを使用してKNNを「トレーニング」(トレーニングを必要とする方法ではなく、トレーニングと同等であることはわかっています)-テストサブセットを分類し、分類エラーを取得します/パフォーマンス - 検証テストを実施する意味は何ですか?
よろしくお願いします。
編集:私はそれを行うことができたと思いますが、それがあまり求めていなければ、私が何かを見逃していないか見てもらえますか? これはランダムな場合の私のコードです:
たくさんのご協力ありがとうございました
python - 教師あり機械学習を使用したテキストの匿名化
会社名や個人名を含むテキスト文書がたくさんあります。上記が手動で匿名化されたテキスト文書を整列させました (名前を単一の一意の文字に置き換えました)。
このコーパスを使用して、目に見えないドキュメントの自動匿名化を実行するシステムをトレーニングしたいと考えています。つまり、単語を文字に置き換えるだけです。第一の問題は、匿名化する単語を認識することであり、第二の問題は、単語を一意の文字に置き換えることです。私は二次問題を行うことができます。
Python が推奨されており、sklearn には必要なツールが含まれている必要があると考えています。
これについてどうすればいいですか?教師あり学習に関するスタックオーバーフローに関する記事はたくさんありますが、それらが私の状況と一致するかどうかはわかりません。これは解決するのがかなり簡単な問題だと思います。必ずしも完全な解決策を探しているわけではありませんが、いくつかの開始点があればよいでしょう。また、どのアルゴリズムがよりうまく機能するかについての洞察も大歓迎です。
android - Androidセンサー(加速度計)データセットを保存して比較し、パターンに一致させます
私は学習し、アグレッシブな運転行動、つまり急なターン、急ブレーキなどを評価するアンドロイドアプリケーションを開発しています...
学習アルゴリズムを作成しようとしています。私のアプローチは、間違って駆動されたときにセンサー データを取得し、複数のセンサー (加速度計、ジャイロスコープ、磁力計) のデータ セットを作成することです。
複数のデータセット (センサーごと) が保存されると、アプリケーションはデータセットをセンサーの現在の値と比較し続けます。パターンが一致した場合、同じアクション (誤り) が発生しました。現在、配列を使用していて、機能しない複数の値を比較している
ため、センサーデータのパターンを比較して一致させる方法に関するAPIまたはソリューションはありますか?
または、あなたがより良いと思う問題の別の解決策はありますか?
私は何週間もここで立ち往生しているので、それは大きな助けになるでしょう:(
machine-learning - これには、どの AI のドメインが必要ですか?
整数で識別される大量のプロパティ (~20) を持つ多数のアイテム (~500,000) を持つデータベースがあります。約 50,000 の異なるプロパティがあります。
アイテムのプロパティに基づいて、アイテム間の最適な一致を見つけるプログラムを作成したいと考えています。マッチングの良さを定義するメトリックが利用可能ですが、マッチングが行われてからしばらく時間がかかります。2 つのアイテムが同じプロパティを共有しているからといって、それがうまく一致するとは限りません。このプログラムは、既に作成された一連の一致 (メトリックがわかっている各一致) から、どのグループのプロパティを組み合わせて最適な一致を作成するかを学習する必要があります。
学習プロセスの後、よく学習されたものと部分的に同じ特性を持つ新しいアイテムに最適な一致を作成できるはずです。さらに、プログラムは、メトリックが利用可能になるとすぐに、それ自体を改善するために行う各一致から学習する必要があります。
どうすればこれを引き受けることができますか? これが AI のどのドメインに該当するかはわかりませんが (タイトルの由来)、手動で行う方法なので、プログラムがプロパティによってアイテムを分類し始めると思いました... どのアルゴリズムを使用すればよいでしょうか?確かに調べますか?
編集:アイテムのプロパティの一部またはすべてがカテゴリにつながるホップフィールド ネットワークについて考えましたが、この規模で機能するかどうかはわかりません。