問題タブ [statistics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - SQLServerの統計
したがって、この1つのプロジェクトでは、定期的に(1分ごとに)実行される一連のクエリがあります。「データベースエンジンでクエリを分析する」を使用してそれらをチェックしました。
それらは非常に単純です:processed='0'であるtablexから*を選択します
処理済みのインデックスがあり、各クエリは1MMレコードのテーブルで1000行未満を返す必要があります。
アナライザーは、これについていくつかの統計を作成することを推奨しました。それで、私の質問は、これらの統計は何ですか?彼らは本当にパフォーマンスを助けますか?上記のようなテーブルの場合、どのくらいの費用がかかりますか?
自分自身をSQLServerの経験豊富なユーザーと呼ぶことは決してないことを覚えておいてください...そして、このアナライザーを使用するのはこれが初めてです。
math - プログラマー向けの統計ツール
統計ツールの購入を検討しています。これは、一部は非プログラミング ユーザー (臨床研究を行っている) によって使用され、一部はプログラマーによって使用されるため、使いやすさと自動化の間の適切な妥協点を見つけようとしています。もちろん、コストの問題はありますが、しっかりとしたケースを構築できれば、おそらく商用パッケージを購入できるので、無料オプションに完全に限定されるわけではありません.
これまでのところ、オプションは次のとおりです。
- Statistica (一部の非プログラマーは既に知っています)
- Matlab 統計ツールボックス (プログラマーは既に matlab を使用しています)
- R 言語 (非プログラマー向けの UI が必要)
- 何かを Excel にハックする (楽しくはないが、プログラマーではない人が現在行っていることです)
- ?...
他に何がありますか?業界標準は?どのような特徴的な機能を探す必要がありますか? 何をお勧めしますか、またその理由は何ですか?
理想的には、Linux マシンと Windows マシンの両方で実行できるツールが必要です。
(私は医用画像の仕事をしているので、生物統計とソフトウェア工学統計の両方を行っています)
algorithm - 潜在的ディリクレ配分、落とし穴、ヒント、プログラム
トピックの曖昧さの解消と割り当てのために潜在的なディリクレ割り当てを試しており、アドバイスを求めています。
- どのプログラムが「最良」であるか、最も使いやすい、最良の事前推定、高速の組み合わせ
- 話題性についての直感をどのように取り入れるか。同じ著者によるすべての記事のように、コーパス内のいくつかのアイテムが実際には同じカテゴリにあることを知っているとしましょう。それを分析に追加できますか?
- 乗船する前に知っておくべき予期しない落とし穴やヒントはありますか?
どのようなプログラムでも R または Python のフロント エンドがあればいいのですが、C を扱うことになると思います (そして受け入れます)。
statistics - プログラムでポーカーオッズを計算するにはどうすればよいですか?
私はポーカーオッズを計算するための簡単なゲーム/ユーティリティを書こうとしています。そのための公式について説明しているリソースがたくさんあることは知っていますが、それをコードに変換するのに問題があると思います。特に、テキサスホールデムに興味があります...
私はいくつかの異なるアプローチがあることを理解しています。1つはあなたが見ることができるカードに基づいてあなたがいくらかの手を引くオッズを計算することができるということです。もう1つのアプローチは、特定のハンドを獲得するオッズを計算することです。2番目のアプローチは、より多くのデータ(プレーヤーの数など)を入力する必要があるため、はるかに複雑に見えます。
私はあなたが私のためにそれを書くことを求めていませんが、正しい方向へのいくつかの微調整は助けになるでしょう:-)
statistics - なぜ Wemf と Google Analytics が私に異なることを教えてくれるのですか?
Web サイトは Wemf と Google Analytics で動作しますが、結果が大きく異なります。WEMF は、Google アナリティクスよりも 10 ~ 30 % 多くのページ ビューをカウントしています...これはなぜでしょうか?
Google アナリティクスは JavaScript が有効になっている場合にのみ機能しますが、それがこの違いの理由ではないと思います。数えるべきサイトはスイスの有名新聞。
助言がありますか?
web - ベスト プラクティス: アウトバウンド リンクを追跡する方法
Web サイトのアウトバウンド リンクを追跡するにはどうすればよいでしょうか? 要求は自分のサーバーではなく、宛先サーバーに記録されるためです。
optimization - 疎最小二乗回帰のツール
数十万の例を使用して、疎な高次元 (数千の機能) 最小二乗回帰を実行したいと考えています。派手ではない最適化を喜んで使用します - 確率的勾配降下は問題ありません。
これを行うために既に実装されているソフトウェアを誰かが知っているので、自分で書く必要はありませんか?
敬具。
oracle - Oracle V$OSSTAT
Oracle ビュー V$OSSTAT には、次のようないくつかの操作統計が保持されます。
- IDLE_TICKS プロセッサーがアイドル状態だった 100 分の 1 秒の数 (すべてのプロセッサーの合計)
- BUSY_TICKS プロセッサがユーザーまたはカーネル コードの実行でビジーだった 100 分の 1 秒の数 (すべてのプロセッサの合計)
私が読んだドキュメントでは、これらがリセットされるかどうかについて明確ではありませんでした。誰か知っていますか?
もう 1 つの質問は、システムが経験している平均 CPU 負荷を計算したいということです。そうするために、私は行かなければならないと思っています:
これは正しいです?
08年11月更新
Oracle 10g r2 には、このテーブルに LOAD と呼ばれる統計が含まれています。値が読み取られた時点でのマシンの現在の負荷を提供します。*_ticks データは現時点ではなく「インスタンスの開始以降」であるため、これは他の情報を使用するよりもはるかに優れています。
unix - メモリチェックに相当する時間
UNIX環境で使用time
して、何かにかかった時間を確認できます...
プロセスのメモリ使用量を記録するのに相当するものはありますか?
特に、ピーク割り当てに興味があります。
algorithm - 結果の売上に基づいて「タグライン」キャンペーンを注文するアルゴリズム
ユーザーに「ランダムに」表示される新しい「タグライン」をデータベースに導入できるようにしたいと考えています。(これらのキャッチフレーズは、アニメーション テキストとして紹介として表示されます。)
これらのキャッチフレーズから得られた販売数に基づいて、良いものは少しずつトップに表示されるようにしたいと思いますが、それでも他のものはあまり表示されないようにします.
基本的なアルゴリズムは非常に簡単に思いつくことができましたが、もう少し「統計的に正確」なものが必要です。
どこから始めればいいのか本当にわかりません。基本的な統計以外のことをしたのは久しぶりです。私のモデルは公差に敏感である必要がありますが、明らかに PHD に値する必要はありません。
編集:現在、「コンバージョン率」、つまり注文あたりのヒット数を追跡しています。この値は、アルゴリズムに入力される累積的な「全期間」コンバージョン率として計算するのがおそらく最適です。