問題タブ [machine-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
web-services - 特定の URL の最も一般的な GET パラメータのバリエーションのリストを取得しますか?
私はリンク伝播に関するインテリジェンスの構築に取り組んでおり、正確な URL アドレスからの逆引きが必要な多くの短い URL サービスを扱う必要があるため、同じ URL の複数の近似バージョンを解決できる必要があります。
たとえば、 http://www.example.com?ref=affil&hl=en&ct= 0 のような URL です。
もちろん、特定の状況で GET パラメータを変更すると、特に問題の GET パラメータがプロファイルまたはコンテンツ ID を参照している場合は、まったく別のページを参照できます。
しかし、ページをすばやく解析すると、ページが互いにどの程度似ているかがすぐにわかります。少しの機械学習を使用すると、特定のサイトに対して返されるページのコンテンツに影響を与えない GET パラメータがすぐに明らかになる可能性があります。
URL を送信して非常に類似した URL のリストを取得するサービスは、Google や Yahoo (または Twitter) などによってのみ提供されると想定していますが、この機能を提供していないようです。他のサービスを見つけました。
前述の方法でほぼ同一の URL のグループをクラスター化するサービスを知っている場合は、お知らせください。
私の懸賞金は抱擁です。
c++ - クラスタリング用のC/C++機械学習ライブラリ
多次元データのクラスタリングをサポートするC/c ++機械学習ライブラリにはどのようなものがありますか?(たとえば、K-Means)
これまでに出くわした
- SGI MLC ++ http://www.sgi.com/tech/mlc/
- OpenCV MLL
私は自分自身を転がしたくなりますが、既存のものは、コードにもっと目を向けることで、はるかに優れたパフォーマンス最適化であると確信しています。
machine-learning - 音楽分析ソフトウェア
ご挨拶
私はこれを想像したかもしれませんが、Last.fmが以前に何らかの形式のオープンソースプロジェクトを使用して音楽の分析を実行し、類似した音楽を特定したかどうかは誰にもわかりません。
有料版に移行したので、プレイリストに既知の音楽を追加できるものを作りたいと思います。(コンピューターで同様の音楽を手動でスキャンするのは嫌いです)
それが失敗した-これを置き換えるために私が使用できるシステムを誰かが知っていますか?理想的には、プロセス全体をバッチジョブに自動化するために使用できる何らかの形式のAPI/ソースコードが必要です。
ありがとう、
[編集]理想的には、コンテンツマッチングのラインに沿ってもっと何かを探していました。私は、すべての音楽を整理されていない1つの場所に放り込むタイプの人です。それから怠惰である私は理想的には私に同様の音楽タイプのプレイリストを与えるプレイリストが生成されることを期待します。
Last.fmはhttp://www.audioscrobbler.net/を使用しています-APIを介してデータベースへのアクセスも提供します。
[/編集]
c++ - ニューラル ネットワーク XOR バックプロパゲーション情報が必要
の NN バックプロパゲーションに関するサンプル コードがどこにあるのか、XOR
トレーニング後にシステムをテストできることを知っている人はいますか?
できれば C++ または MATLAB で。
database - 監視カメラ設置場所データベース
django プログラミングをさらに理解するために、A から B へのルートを検索する Google マップ マッシュアップを作成する予定ですが、公共の監視カメラの視点と交差する通りやジャンクションは避けます。そのため、以下を含むデータベースを作成します (GIS 機能のため、おそらく Postgres ベースです)。
- 監視タイプ(監視カメラ、スピードカメラ、ロードチャージカメラなど)
- 地理的位置
- タイムアウト (主にスピードカメラに使用)
もちろん、このデータはユーザーが自由に編集できます。ただし、開始するには、実行するためのデータが必要です。監視カメラの(おおよその)地理的位置を含む公開データベースはありますか?
artificial-intelligence - ストリートビュー画像から監視カメラの位置を抽出
以前の質問に関連して、コンピュータ ビジョン アルゴリズムを使用して、Google ストリートビューの写真から監視カメラの位置を抽出する現実的な可能性はありますか? 私はその分野の専門家ではありません。しかし、顔検出などよりは簡単なはずです。
artificial-intelligence - Wolfram Alphaはどのように機能しますか?
テーブルと生データのテーブルの背後で、Wolfram Alpha はどのように機能するのでしょうか?
サイトを動かしているさまざまな人工知能のメカニズムがあると思いますが、このようなものをどのように組み立てるかはわかりません。このようなものがどのように作成されるかをプログラマが理解するのに役立つ説明はありますか? ナレッジ ベースはそれ自体で学習しますか、それとも非常に具体的な詳細を非常に組織化された方法で学習しますか? このタイプのデータを格納するために、どのような構造と言語が使用されていますか?
明らかに、これは大きな問題であり、ここで完全に答えることはできませんが、いくつかの一般的な概念を知っておくとよいので、それらに基づいて構築し、独自の調査を行うことができます。
algorithm - 生成アルゴリズムと識別アルゴリズムの違いは何ですか?
生成アルゴリズムと 識別アルゴリズムの違いは何ですか?
c# - タイプミスの機械学習
あなたがタイプミスのエントリを作るとき、グーグルは提案を出します、彼らはそれをどのように行いますか?
machine-learning - 「学習率」を選択して調整するための良い方法が必要
下の図では、目的の出力(赤い線)を生成することを学習しようとしている学習アルゴリズムを見ることができます。学習アルゴリズムは、後方エラー伝播ニューラルネットワークに似ています。
「学習率」は、トレーニングプロセス中に行われる調整のサイズを制御する値です。学習率が高すぎる場合、アルゴリズムは迅速に学習しますが、その予測はトレーニングプロセス中に大きくジャンプします(緑色の線-学習率0.001)。低い場合、予測のジャンプは少なくなりますが、アルゴリズムは学習時間がはるかに長くなります(青い線-学習率0.0001)。
黒い線は移動平均です。
学習率を調整して、最初は目的の出力に近づくように収束させ、その後、正しい値に焦点を合わせることができるように速度を落とすにはどうすればよいですか?
学習率グラフhttp://img.skitch.com/20090605-pqpkse1yr1e5r869y6eehmpsym.png