問題タブ [data-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
80 参照

sql-server - SQL Server で不明なソースのデータを見つける

別のサーバーから実行された DTS や VB スクリプトなどのサード パーティ サービスによって操作されている可能性がある SQL Server データベースがあります。

それがそうであることをどのように見つけ、それらの場所をどのように見つけることができますか?

注:文書化する必要があるため、この質問をするのはばかげていることはわかっていますが、これらのことが起こると思います。

0 投票する
3 に答える
10656 参照

javascript - Javascript JSON データ操作ライブラリ

私は現在、かなりの量の JSON データが前後に送信され、JavaScript オブジェクトのリストとしてブラウザーによって保存されるプロジェクトに取り組んでいます。例えば:

このデータを効率的に操作するために、あらゆる種類のインデックス作成および並べ替えアルゴリズムをコーディングしていることに気づきました。この種のことは以前に行われたに違いないと考え始めています。

この種のデータ操作を実行するためにExt.data.StoreおよびExt.data.Recordオブジェクトを使用した経験がありますが、ジュニア開発者にとっては複雑すぎると思います。私が取り組んでいるプロジェクトは小さなモバイル アプリケーションです。そのためだけに 300K 以上のライブラリを追加する余裕はないので、本当に最小限のものが必要です。

次のような Javascript JSON 操作フレームワークがある場合のアイデア:

  1. を保存することができ、
  2. 取得
  3. ソート
  4. JSONデータを反復処理し、
  5. クリーンな APIを使用して、
  6. 最小限のパフォーマンスの低下(モバイルには多くの計算能力がありません)
  7. 理想的には<10Kの小さなペイロードですか?

私はあまりにも多くを求めているかもしれませんが、誰かがこのようなものを使用していることを願っています...私が探しているのは、 jQueryに相当する JSON です。おそらくそれほど風変わりではありません。

0 投票する
1 に答える
62 参照

php - クエリからのデータの処理

私は codeigniter のモデル クラスで 'get' 関数を書いていますが、返されたデータの一部を処理する必要があります。

結果は次のようになります。

問題は、回答がパイプで区切られた回答のリストとして保存されることですが、代わりに関数がそれを分解された配列として返すようにしたいです。構文と、配列を作成して置換する方法、または上で貼り付けたオブジェクトの配列に追加する方法がわかりません。

私が試したいくつかのコードがコメントアウトされているのを見ることができます。

理想的には、'answer' => '4555|||', 私がしたいのではなく

使用して配列を作成するのに問題はありexplodeませんが、元の codeigniter アクティブ レコードの結果を変更する方法がわかりません。

0 投票する
2 に答える
3770 参照

r - Rの時系列データのスライド時間間隔

不規則な時系列データセットの興味深い統計を抽出しようとしていますが、その仕事に適したツールを見つけることができません。定期的にサンプリングされた時系列またはインデックスベースの時系列をいつでも操作するためのツールは非常に簡単に見つかりますが、解決しようとしている問題にはあまり運がありません。

まず、再現可能なデータセット:

時間は秒単位であると想定します。シリーズにはほぼ1700秒(30分は恥ずかしがり屋)があり、vecZその間に5001のエントリがあります。(注:を使用してみxtsますがxts、日付情報が必要なようです。関連性がない場合は、特定の日付を使用したくありません。)

私の目標は次のとおりです。

  • 各ポイントの3分前と3分後の値のインデックスを特定します。時間は連続しているので、2つのポイントが正確に3分離れているとは思えません。私が見つけたいのは、与えられたポイントの最大3分前、少なくとも3分後のポイント、つまり次のようなものです(擬似コードで):

    backIX(t, vecZ, tDelta) = min{ix in length(vecZ) : t - time(ix) < tDelta} forwardIX(t, vecZ, tDelta) = min{ix in length(vecZ) : time(ix) - t > tDelta}

    したがって、3分間、tDelta = 180。の場合t=2500、の結果はforwardIX()3012(つまり、time(vecZ)[2500]は860.1462、time(vecZ)[3012]は1040.403、つまり180秒後)になり、の出力はbackwardIX()2020(に対応)になります。時間680.7162秒)。

    t理想的には、関数の呼び出しが必要になるため、を必要としない関数を使用したいと思いlength(vecZ)ます。これは、時間のスライディングウィンドウをより効率的に計算できるという事実を無視します。

  • 時間のローリングウィンドウ内のすべての値に関数を適用します。私はこれを見てきましrollapplyたが、これは固定のウィンドウサイズを取ります(つまり、インデックスの数は固定されていますが、時間のウィンドウは固定されていません)。foreachインデックスごとに計算されるループ(または;-))を使用して、これを単純な方法で解決できtますが、特定の時間枠内のすべての値の平均を計算する関数など、いくつかの単純な関数がすでに実装されているかどうか疑問に思いました。これは、ウィンドウ上をスライドする単純な要約統計量を介して効率的に実行できるため、すべてのデータに複数回アクセスして各統計量を計算する関数よりも計算コストが低くなるはずです。いくつかのかなり自然な関数:平均、最小、最大、および中央値。

    ウィンドウが時間によって変化していなくても、ウィンドウサイズを変化させる機能は十分であり、上記の質問の結果を使用してそのウィンドウサイズを見つけることができます。ただし、それでも過剰な計算が必要になるようであるため、時間ベースの間隔を指定できる方が効率的です。

時間枠でのデータのそのような操作を容易にするパッケージがRにありますか、それとも運が悪かったので、独自の関数を作成する必要がありますか?


注1:この質問は、時間のウィンドウをローリングするのではなく、ばらばらの間隔を除いて、同様のことをしようとしています。たとえば、これを適応させて、連続する3分ごとのブロックで分析を行うことができますが、これを適応させる方法がわかりません。 3分間隔でローリングします。

注2:オブジェクトから数値ベクトルへの切り替えzoo(時間の場合)により、最初の目標の距離測定/ウィンドウエンドポイント識別の問題が大幅にスピードアップしたことがわかりました。これはまだ単純なアルゴリズムですが、zooオブジェクトの操作は単純なアプローチには最適ではない可能性があることに注意してください。

0 投票する
2 に答える
1203 参照

r - 散布図として行ごとに2列の最小値と最大値をプロットする方法

次のようなデータフレームがあります。

X軸に最小の長さ(行あたり)、Y軸に最大の長さ(行あたり)の散布図を作成したいと思います。私が試してみました:

ただし、これは両方の列の最大値に対して両方の列の最小値の単一のポイントをプロットします。間違った機能を使用していますか?それとも、データフレームを何らかの方法で操作する方がよいでしょうか?ナイーブを許してください、私はまだRとggplot2にかなり慣れていません。

どんな助けでも大歓迎です。

編集:上記のコードを使用したプロット例:

散布図の例

0 投票する
0 に答える
189 参照

javascript - JavaScript でのデータ操作

次のようなフォルダーを含む情報の配列があります。

必要なデータのタイプは次のとおりです。

問題は、任意の数のフォルダーと任意のレベルの階層が存在する可能性があるということです。

この変換を達成する方法はありますか?

0 投票する
3 に答える
297 参照

r - パネルデータのイベントまでの時間

私は国の年のパネルデータセットを持っています。イベントからの時間を計算し、時間の経過とともに減衰できる国ごとのイベントの現在の合計を取得したいと思います。timeSinceEventパッケージ内の関数を使用しています。この関数はdoBy、必要な値を持つデータ フレームを返しますが、これをメインの df に適用するのに問題があります。

私はこれを使ってみました:

としても

ほとんど役に立たない。私は関数をステップ実行しましたが、それは私が望むことをしているように見えますが、私がそれを呼び出す方法に問題があると思いますか?

0 投票する
1 に答える
2399 参照

r - 文字列の変形、集約/連結

国年形式でデータセットを集計しています

conflictID.a複数の行を単一の行に集約するインスタンスの場合、集約されたすべての値を取得できるように連結したいと思いますconflictID.a

サンプルデータは次のとおりです。

dput(tail(subset(data, select=c(ccode.a,year,onset,conflictID.a)), 100))

問題を再現するために人為的にデータを変更しました。yearしたがって、 と の値が同じでccode.aあるが値が異なる2 つ以上の行がある場合が 2 つあります。これらを集約して、それぞれ,ごとにconflictID.a1 つの行に連結したいと考えています。ccode.ayear

0 投票する
1 に答える
261 参照

javascript - Google アナリティクス データの操作 - 教育目的: 信頼に値する G. アナリティクス レポート

ページビュー、ユニーク ビジター、ビジター数を増やす修正された Javascript が必要です。

G. Analytics レポートを人為的に変更する際に特定のパターンがあるかどうかを確認したいため、教育目的で

私はこれをコーディングしましたが、動作しません:

そして、このコードはページビューのみを変更します:

最近、基礎となるすべてのデータと完全に一致しない分析レポートを表示したため、質問しています

ありがとう

0 投票する
3 に答える
1156 参照

javascript - Javascript Analytics コード操作 (G. Analytics)

私の仕事では、Google アナリティクスの有効性に関する調査プロジェクトを行っています (主にフリッパで検証されたレポートに関して) --> G. アナリティクスを完全に偽造できるかどうかを確認します (単純な「はい」ではうまくいきません)。

G. Analytics コードを次のように変更しました。

実行すると、複数の訪問と訪問者が生成されるようになりました。__utma の 2 番目の数字は、ページビューごとに変化することがわかります。その数字は、visitorId です。変化すると、新しい訪問者を獲得したことを意味します。

問題は、私が取得した統計が次のようになっていることです。

  • 訪問数: 1,785
  • ユニークビジター: 1,781
  • ページビュー: 2,188
  • ページ/訪問: 1.23
  • 平均 訪問時間: 00:00:03
  • 直帰率: 96.13 % %
  • 新規訪問: 99.78 %

平均値の極端な低下はご遠慮ください。訪問期間!

彼らがこれに似ている前に:

  • 訪問数: 135
  • ユニークビジター: 118
  • ページビュー: 383
  • ページ/訪問: 2.84
  • 平均 滞在時間: 00:04:22
  • 直帰率: 57.78 %
  • % 新規訪問: 68.89 %

ここで私の質問: G. 分析コードをどのように変更する必要がありますか (可能な場合)、次のようにします。

  • 訪問: 135 * 10 = 1350
  • 固有の訪問者: 118 * 10 = 1180
  • ページビュー: 383 * 10 = 3830
  • ページ/訪問: 2.84
  • 平均 滞在時間: 00:04:22
  • 直帰率: 57.78%
  • % 新規訪問: 68.89%

したがって、基本的に、訪問数、ユニーク訪問者数、ページビュー数を10倍に増やしますが、他の統計は同じままにします。

http://jsfiddle.netの例は大歓迎です

PS: 下手な英語で申し訳ありません (母国語ではありません)。