問題タブ [sampling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 連鎖ハッシュテーブルからランダムな要素を効率的に選択しますか?
練習のためだけに(宿題としてではなく)、私はこの問題を解決しようとしてきました(CLRS、第3版、演習11.2-6):
サイズmのハッシュテーブルにn個のキーを格納し、チェーンによって衝突を解決し、最長のチェーンの長さLを含む各チェーンの長さを知っているとします。ハッシュテーブル内のキーの中からランダムに均一にキーを選択し、予想時間O(L *(1 + m / n))で返す手順を説明します。
これまで私が思っていたのは、各キーが返される確率は1/nだということです。1からnまでのランダムな値xを取得しようとし、最初にバケットでソートされ、次にバケット内のチェーンに沿ってx番目のキーを順番に見つけようとすると、O(m)が正しいバケットを見つけるのにかかります。バケットを1つずつ通過し、O(L)時間で、チェーン内の適切なキーを取得します。
video - ビデオストリームから、指定されたサンプリング間隔で区切られたすべての画像を選択しますOPENCV
私はプロジェクトにOpenCVを使用していますが、まったくの初心者です。
大容量記憶装置リポジトリにビデオファイルがあり、入力の特定のサンプリング間隔で区切られているビデオストリームのすべてのフレームにアクセスするメソッドを作成したいと考えています。
ビデオは複数の形式(AVI – WMV – MPEG-2 – MPEG-4)にすることができます。
私はこの方法が次のように機能するはずだと考えていました。
OpenCVメソッドを使用してそのようなメソッドを実装する方法について、いくつかのコード、または少なくとも指示を提供するのを手伝ってもらえますか?
r - randomForest32ファクター制限を回避するためのRサンプリング
ファクターの32レベルのrandomForestパッケージ制限を回避しようとしています。
因子変数の1つに100レベルのデータセットがあります。
次のコードを記述して、置換を伴うサンプリングを使用するとどのように見えるか、および特定の%のレベルを選択するのに何回試行するかを確認しました。
私が議論しているのは、交換の有無にかかわらずサンプリングするかどうかです。
私は考えています:
- 100の要因のうち32のサンプルを取得し、
- それらの行を使用してrandomForestを実行し、
- randomForestとを使用してテストセットを予測する
- このプロセスを(a)3回(交換なし)または(b)10〜15回(交換あり)繰り返します。
- 3つまたは10〜15の予測値を取得し、平均を見つけて、それを最終的な予測子として使用します。
誰かがこのようなことを試みたのか、私がルールを破っているのか(バイアスの導入など)、または誰かが何か提案をしているのかどうか、私は興味があります。
注:この質問は、統計-オーバーフロー/相互検証にもクロスポストしました。
c++ - C++/Ubuntu でオーディオ入力から生のオーディオを録音する
たとえば、ラップトップの内蔵マイクから生のオーディオ値をリアルタイムでテキスト ファイルに単純に記録する最も簡単な方法は何ですか。私は C++ で作業したいのですが、これを達成する言語/方法でも問題ありません。
audio - 異なるオーディオ ファイルを検索して、等しい短いサンプルを探します
いくつかの異なるミックスやリミックスなど、複数 (少なくとも 2 つ) の異なるオーディオ ファイルを検討してください。素朴に言うと、2 つ以上のファイルでほぼ等しいサンプル、特にボーカルを検出できるはずです。もちろん、ボーカル サンプルが変更、ストレッチ、ピッチ、リバーブされすぎていない場合に限ります。等
では、どのようなアルゴリズムや技術でこれを行うことができるのでしょうか? たとえば、ユーザーはすべてのファイルに可能な限りタイム マーカーを設定しようとするでしょう。タイム マーカーは、おそらく等しいサウンド、ボーカルなどを含む、比較するデータ ウィンドウを記述します。
どんな方法でもwavデータを直接比較しようとする直接的なアプローチは役に立たないことを私は知っています。しかし、周波数領域データ (FFT など) がある場合でも、比較ウィンドウをタイム スケールでシフトするような比較アルゴリズムを使用する必要があります。すべてのファイルに対して。
ご提案いただきありがとうございます。
ruby - 配列の一意のサブセットをランダムにサンプリングする
配列がある場合:
各サブセットの要素が一意になるように、配列のサブセットをランダムに選択するにはどうすればよいですか? つまりa
、可能なサブセットは次のようになります。
a の実際のサイズは非常に大きいため、可能なサブセットをすべて生成することはできず、非常に多くのサブセットがあります。現時点では、「ランダム ウォーク」のアイデアを使用しています。a の各要素について、「コインを投げ」、コインが表に出た場合はそれを含めますが、これが実際にスペースを均一にサンプリングするかどうかはわかりません。真ん中に偏っているように感じますが、中くらいのサイズの可能性がもっとあるので、これはパターンマッチングをしている私の心かもしれません.
正しいアプローチを使用していますか、またはランダムにサンプリングするにはどうすればよいですか?
(これは言語にとらわれず、「数学的な」質問であることは承知していますが、実際には Mathoverflow の資料ではないと感じました。実用的な回答が必要です。)
matlab - Matlab - 多次元データの階層化サンプリング
コーパスを階層化された方法でトレーニング セットとテスト セットに分割したいと考えています。
観測データ ポイントは次のようにマトリックス A
に配置されます。
マトリックスの各列は、個別の機能を表します。
Matlab では、cvpartition(A,'holdout',p)
関数はA
ベクトルである必要があります。マトリックスA
と同じアクションを実行するにはどうすればよいですか。つまり、結果のセットは、元のコーパスとほぼ同じ各機能の分布を持ちます。
c - オーディオRLPを読む
私はFezPanda2を介してマイクからサウンドサンプルを取得しようとしています。それを実現するためにrlpを使用しています。これが私のコードです:
問題は、これらのサウンドサンプルでfftを実行しているため、unsignedcharではなくfloat値が必要なことです。したがって、float値を提供する変更が必要です。何か案は?
touchscreen - タブレット PC のペン位置の一定の高いサンプリング レート
実験 (人間を対象としたトレーニング研究) では、タブレット PC (Thinkpad X61t、Windows 7) で一定の高い (100 Hz など) サンプリング レートでペンの位置を記録しようとしています。残念ながら、現在、サンプリング間隔は可変 (15 ~ 16 ミリ秒で、外れ値がかなり長いものもあります) しか取得できません。これは、おそらく画面のリフレッシュ レートと測定ノイズに関連しています。私たちのプログラマーは、以前のセットアップ (X60t、Windows 7) で一定のサンプリング レート (100Hz) を得ることができましたが、現在のシステムではそれを機能させることができないようです (同一の EXE ファイルは、 2 つのシステム)。両方のシステムに同じドライバーがインストールされているかどうかは定かではありませんが (彼は最初のシステムで作業していたときは追跡していませんでした)、過去数週間で別のドライバーとシステム (Windows XP など) を試しました。
これについての助けをいただければ幸いです - ドライバーが試すべき提案、プログラミングのトリック (ソフトウェアは C で書かれています)、問題の説明...
ios - iOS音源
同様のことをする必要があるため、iOS でのサウンド生成に関するこの例を見ていますが、理解できない部分がいくつかあり、誰かがそれを手伝ってくれることを望んでいました。
コードのこの部分では:
何のための部品なのかよくわかりませんtheta += theta_increment;
。私にとっては、for ループ内で次のようなことを行う方が理にかなっています。
なぜそれがうまくいかないのですか?また、コードのこの部分が何のためにあるのかわからないif (theta > 2.0 * M_PI)
ので、それについての説明も大歓迎です。