問題タブ [machine-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
language-agnostic - ピアツーピア システム全体でアイテムを確実に、しかし最小限に配布する方法
クエリ可能なピア ツー ピア システムがある場合は、
- ネットワーク全体のクエリの総数を減らす (「人気のある」アイテムを広く配布し、「類似の」アイテムをまとめて配布することにより)
- 各ノードで余分なストレージを避ける
- クライアントのダウンタイム、ハードウェア障害、およびユーザーの離脱に直面して、中程度に希少なアイテムであっても良好な可用性を保証します (おそらく、アーキビスト/歴史家にとって希少なアイテムを検出します)
- ネットワーク パーティションが発生した場合にクエリが一致を見つけられないことを回避する
これらの要件を考えると:
- 標準的なアプローチはありますか?そうでない場合、尊敬されているが実験的な研究はありますか? 私は分散スキームに精通している人もいますが、ロバスト性の学習に実際に取り組んでいるものは見たことがありません。
- 明らかな基準がありませんか?
- この問題に取り組んだり、解決したりすることに興味のある人はいますか? (もしそうなら、私が今週末に一緒に投げた非常に不十分なシミュレーターの一部をオープンソースにして喜んで、一般的に役に立たないアドバイスを提供します)。
@cdv: 今ビデオを見ましたが、とても良いです。プラグイン可能な配布戦略に完全に到達しているとは思えませんが、90% は確実に達成されています。ただし、質問は、このアプローチとの有用な違いを強調しており、私のさらなる懸念のいくつかに対処し、フォローアップするための参考文献をいくつか提供してくれます。したがって、質問は未解決であると考えていますが、暫定的にあなたの回答を受け入れています。
algorithm - テキストコンテンツに基づいてどのように分類しますか?
コンテンツに基づいてテキストのカテゴリを自動的に見つけるにはどうすればよいですか?
algorithm - マッピング アプリケーションのクラスタリング アルゴリズム
マップ上のポイントのクラスタリング (緯度/経度) を検討しています。高速でスケーラブルな適切なアルゴリズムに関する推奨事項はありますか?
より具体的には、一連の緯度/経度座標とマップ ビューポートがあります。混乱を取り除くために、互いに接近しているポイントをクラスター化しようとしています。
私はすでに問題の解決策を持っています (こちらを参照)。問題を効率的に解決する正式なアルゴリズムがあるかどうか疑問に思っているだけです。
artificial-intelligence - 機械学習、AI、ソフト コンピューティング
これら 3 つの密接に関連する分野の違いは何ですか? それらがすべて (CS を除いて) 一部である 1 つの特定の全体はありますか?
machine-learning - サポート ベクター回帰を実装する最適な MATLAB ツールボックスは?
SVM に関するこのウィキペディアの記事には、サポート ベクター マシン用の MATLAB ツールボックスのさまざまな実装へのリンクが多数あります。速度、使いやすさなどの点で、これらのうちどれが最適かを誰か提案できますか?
matlab - matlab PNN でクラスの確率を見つけ、ROC プロットを作成する
MATLAB で確率的ニューラル ネットワーク分類実験をセットアップしました。コマンドを使用して、目に見えないデータのクラスを取得できますsim
。分類子が計算するクラスの確率を取得する方法はありますか? また、受信者動作特性曲線をプロットして、分類子の ROC の下の面積を計算する直接的な方法はありますか?
statistics - シミュレーション/統計/予測の大学院レベルの学位?
誰かがこれについて何か洞察を持っているかどうか疑問に思います。コンピュータサイエンス関連の学位を取得するために大学院に行くことを考えています。私は、問題を解決するために統計パッケージやシミュレーションを使用して問題に取り組んでいる人々に常に興味をそそられてきました。これらのことについての幅広い知識を得るために、私は何を勉強しますか?彼らは機械学習に分類されますか?ありがとう
algorithm - Google の「もしかして?」アルゴリズムの仕事?
ポートフォリオ管理ツールの社内 Web サイトを開発しています。多くのテキスト データ、会社名などがあります。「もしかして: xxxx」というクエリに非常に迅速に応答するいくつかの検索エンジンの機能に、私は本当に感銘を受けました。
ユーザーのクエリをインテリジェントに取得し、生の検索結果だけでなく、「もしかして?」で応答できる必要があります。可能性の高い代替回答がある場合の応答など
[私はASP.NETで開発しています(VB - 私に反対しないでください!)]
更新: OK、何百万もの「無料ユーザー」なしでこれをどのように模倣できますか?
- 「既知」または「正しい」用語ごとにタイプミスを生成し、ルックアップを実行しますか?
- 他のよりエレガントな方法はありますか?
machine-learning - ベイジアン ネットワークのチュートリアル
初心者がベイジアン ネットワークを学ぶのに最適な本はどれですか?
artificial-intelligence - 分類アルゴリズムのパフォーマンスの測定
手に分類の問題があり、機械学習アルゴリズムで対処したいと思います(ベイズ、またはマルコフ、おそらく問題は使用する分類器に依存しません)。トレーニングインスタンスの数を考えると、データの過剰適合の問題を考慮に入れて、実装された分類器のパフォーマンスを測定する方法を探しています。
つまり、N [1..100]のトレーニングサンプルが与えられた場合、すべてのサンプルでトレーニングアルゴリズムを実行し、これとまったく同じサンプルを使用してフィットネスを測定すると、データの過剰適合の問題に陥る可能性があります。分類器はそれを認識します。トレーニングインスタンスの正確な答えは、多くの予測力を持たずに、フィットネス結果を役に立たなくします。
明らかな解決策は、手作業でタグ付けされたサンプルをトレーニングとテストサンプルに分離することです。トレーニング用に統計的に有意なサンプルを選択する方法について学びたいと思います。
ホワイトペーパー、本のポインタ、PDFは大歓迎です!