問題タブ [aggregate]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - SQL: 集計関数とグループ化
Oracleemp
テーブルを考えてみましょう。と で最高の給与を持つ従業員を取得したいと思いdepartment = 20
ますjob = clerk
。また、「empno」列がなく、主キーに多数の列が含まれているとします。これは次の方法で実行できます。
これは機能しますが、テスト deptno = 20 と job = 'CLERK' を複製する必要があり、これは避けたいと考えています。これを書くためのよりエレガントな方法はありgroup by
ますか? ところで、これが重要な場合、私は Oracle を使用しています。
python - なぜ SQL 集計関数は Python や Java (または Poor Man's OLAP) よりも非常に遅いのですか?
本当の DBA の意見が必要です。Postgres 8.3 は、私の Macbook Pro でこのクエリを実行するのに 200 ミリ秒かかりますが、Java と Python は 20 ミリ秒 (350,000 行) 未満で同じ計算を実行します。
SQL データベースを使用する場合、これは正常な動作ですか?
スキーマ (テーブルには調査への回答が保持されます):
コンテキストのために Java と Python でいくつかのテストを作成しましたが、それらは SQL をクラッシュさせます (純粋な python を除く):
sqlite3 でさえ、すべての列が文字列であると仮定しているにもかかわらず、Postgres と競合します (対照的に、Postgres で整数の代わりに数値列に切り替えるだけでも、10 倍の速度低下が発生します)。
成功せずに試したチューニングには次のものが含まれます(盲目的にいくつかのWebアドバイスに従います):
私の質問は、ここでの私の経験は正常ですか?これは、SQL データベースを使用するときに期待できることですか? ACID にコストがかかることは理解できますが、これはちょっとおかしいと思います。リアルタイムのゲーム速度を求めているわけではありませんが、Java は 20 ミリ秒未満で数百万の double を処理できるため、少しうらやましく思います。
シンプルな OLAP を低価格で (お金とサーバーの複雑さの両方の点で) 実行するより良い方法はありますか? 私は Mondrian と Pig + Hadoop を調べましたが、さらに別のサーバー アプリケーションを維持することにそれほど興奮しておらず、それらが役立つかどうかもわかりません。
いわば、Python コードと Java コードは社内ですべての作業を行っています。それぞれ 350,000 個のランダムな値を持つ 4 つの配列を生成し、平均を取ります。タイミングには世代を含めず、平均化ステップのみを含めます。Java スレッドのタイミングは 4 つのスレッド (配列あたり平均 1 つ) を使用し、やり過ぎですが、間違いなく最速です。
sqlite3 のタイミングは Python プログラムによって駆動され、ディスクから実行されます (:memory: ではありません)。
Postgres が舞台裏でさらに多くのことを行っていることは認識していますが、これは読み取り専用データであるため、その作業のほとんどは私にとって重要ではありません。
Postgres クエリは、その後の実行でタイミングを変更しません。
Python テストを再実行して、ディスクからスプールすることを含めました。タイミングは大幅に遅くなり、4 秒近くになります。しかし、Python のファイル処理コードはほとんど C で書かれていると思います (csv lib ではないかもしれませんが)。これは、Postgres がディスクからストリーミングしていないことを示しています (または、あなたが正しいので、お辞儀をする必要があります)。誰がストレージ層を書く前に!)
interface - インターフェース使用時の UML 集約
各クラスが実装クラスではなく、他のクラスのインターフェースへのリンクを持つように、UML で 2 つのクラス間の集約関係を表すにはどうすればよいですか?
たとえば、iFoo を実装するクラス Foo と、iBar を実装する Bar があります。Foo には iBar 型のメンバー変数が必要であり、Bar には iFoo 型のメンバー変数が必要です。
2 つの実装クラス間で集計を作成すると、メンバーはスーパークラスではなく、実装クラスの型になります。また、インターフェイス間の集約は UML では無効です (あまり意味がありません)。
aggregate - NDepend CQL カウント クエリ
特定のクラスのパブリック メソッドのテーブルと、NDepend CQL での各メソッドの使用数のクエリを実行したいと考えています。現在、クエリは次のようになっています。
CQL でクエリを集約することは可能ですか?
sql - GROUP BY を使用して MySQL で文字列を連結する方法は?
基本的に、問題はこれからどのように取得するかです。
これに:
sql - テーブルから最新の行を結合する方法は?
この形式の問題に頻繁に遭遇しますが、まだ適切な解決策を見つけていません。
e コマース システムを表す 2 つのデータベース テーブルがあるとします。
システム内のすべてのユーザーについて、ユーザー情報、タイプ = '1' の最新の注文情報、およびタイプ = '2' の最新の注文情報を選択します。これを1つのクエリで実行したい。結果の例を次に示します。
sql-server - SQL クエリで分割範囲を合計する
サーバーのステータスを含むテーブルがあります
開始日と終了日を指定して、その間にサーバーが各状態で費やした時間を要約するクエリが必要です。また、サーバーが不明な状態で費やした時間をクエリで返したいと考えています。
したがって、たとえば次のデータの場合
範囲を提供した。
結果を返したい:
この質問は、SQL クエリで分割された日付範囲を結合することに多少関連しています。
php - Google フィード API を使用してフィードの更新を検出する方法
私はブログ アグリゲーターのウェブサイトを運営しており、RSS フィードの膨大なリストをチェックして新しい投稿を 1 時間ごとに確認しているため、フィード全体を読み取る cron ジョブを作成する代わりに、 Google フィード API またはGoogle AJAX フィード APIを使用できれば幸いです。更新されているかどうかを確認します。このリンクテキストのように
sql - T-SQL を使用して隣接するレコードのみを集計する
次のデータを含むテーブルがあります(例のために簡略化されています)
日付は期間を表し、ID はその期間中のシステムの状態であり、量はその状態に関連する値です。
私がやりたいのは、同じID 番号を持つ隣接する行の金額を集計することですが、連続した実行を組み合わせることができるように、全体的な順序は同じに保ちます。したがって、次のようなデータになりたいと思います。
SPに入れることができるT-SQLソリューションを求めていますが、単純なクエリでそれを行う方法がわかりません。何らかの反復が必要になるのではないかと思いますが、その道をたどりたくありません。
この集計を行う理由は、プロセスの次のステップで、シーケンス内で発生する一意の ID でグループ化された SUM() と Count() を実行して、最終的なデータが次のようになるようにするためです。
しかし、私が簡単なことをすると
元のテーブルでは、次のようなものが得られます
これは私が望むものではありません。
linq-to-sql - 多対多のいずれかの側のCOUNT(*)を取るための最も簡潔なLINQ To SQL?
健全性チェックを手伝ってください。多対多の関係を想定すると:
投稿、PostTagAssoc、タグhttp://www.codingthewheel.com/pics/many_to_many.gif
タグ(または投稿)ごとに、割り当てられた投稿(またはタグ)の総数を示す結果セットを取得するための最も簡潔な方法(LINQ to SQLを使用)は何ですか?
ありがとう!