問題タブ [data-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - ネストされたオブジェクト、配列、または JSON にアクセスして処理するにはどうすればよいですか?
オブジェクトと配列を含むネストされたデータ構造があります。特定の値または複数の値 (またはキー) にアクセスするにはどうすれば情報を抽出できますか?
例えば:
name
の 2 番目のアイテムのにアクセスするにはどうすればよいitems
ですか?
sql - カテゴリカル値をブール列 SQL にピボットする
データマイニングを容易にするために、データセットを「平坦化」しようとしています。各カテゴリ列を複数のブール列に変更する必要があります。カテゴリ値を含む列があります。たとえば、次のとおりです。
このテーブルをピボットする方法を探しており、この ID の値が A か B かを示す集計関数を使用しています。
結果:
PIVOT を使用してみましたが、その中で使用する集計関数がわかりません。
SFでも答えを探しましたが、何も見つかりませんでした...
MS-SQL 2012 を使用しています。
どんな助けでも大歓迎です!オムリ
編集:
col1 のカテゴリ数は不明であるため、ソリューションは動的でなければなりません。ありがとう :)
r - Rを使用してCSVファイルを異なる列に分割する
これは、 Rを使用してCSVファイルをピボットするためのフォローアップの質問です。
その質問では、列(repository_name)の値に基づいて、1つの列(タイプ)を複数の列に分割したいと思いました。以下の入力データを使用しました。
完全なCSVファイルはhttps://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/twitter_exploratory_analysis/all_events.csvで入手できます。
CSVの最初の30行のdput()は次のとおりです。
その質問は、このコードを提案した@flodelによってよく答えられました。
ただし、ここでリストを並べ替えて、各リポジトリ(repository_name)のイベント(タイプ)が毎月(「created_at」列から抽出された)列に並べ替えられるようにします。
他のいくつかの仮定は次のとおりです。
- タイムスタンプは注文専用であり、行全体で同期する必要はありません
- 「IssuesEvent」が10回繰り返されても、RパッケージTraMineRを使用して配列分析を行うため、これらすべてを保持する必要があります。
- 列の長さが等しくない場合があります
- 異なるリポジトリ( "repository_name")の列間には関係がありません
- 同じリポジトリの異なる月のデータは完全に独立しています
Rでこれをどのように達成できますか?
r - R で CSV ファイルの列名を編集する
シンプルな CSV ファイルがあります。
列名に特定の整数または文字列を追加するにはどうすればよいですか?たとえば、1 や「6 月」などです。私が期待する出力は次のとおりです。
php - データを操作するためのベストプラクティス
サーバーからのajaxリクエストを実行するJavaScriptがあり、そのサーバーからJSONデータが返されます。このデータはJSONですが、スクリプトではデータが配列ベースであり、オブジェクトが含まれていない必要があるため、正しくありません。
同僚は、クライアント側のソリューションを使用して、JSONデータを再作成することでオブジェクトベースのJSONを配列ベースのJSONに変換することを提案しました。
このようなフィルタリングをクライアントのブラウザに頼ってはいけないと思うので、サーバー側にすべきだと思いますか?そのようなデータ構造操作を行うのはサーバーの仕事ではありませんか?
(サーバー側とは、クライアント側で行われるのとまったく同じことを実行しますが、PHPではAJAXリクエストからデータを受信する前に実行することを意味します)
これを行うためのベストプラクティスは何ですか?可能であれば、それぞれの長所/短所を説明してください。
お時間をいただきありがとうございます。
r - R で大きな行列を効率的に中央に配置する
中央に配置したい大きなマトリックスがあります:
colMeans を使用すると、平均値をすばやく効率的に見つけることができます。
しかし、各列からそれぞれの平均を減算する良い (高速でメモリ効率の良い) 方法は何ですか? これは機能しますが、正しくありません。
より良い方法はありますか?
/編集: これは、DWin が書いたさまざまなベンチマークを、他の投稿された提案を含む、より大きなマトリックスに変更したものです。
matmult 関数は新しい勝者のようです! これらを 5e+08 要素マトリックスで実際に試してみたいのですが、RAM が不足し続けています。
r - R内のリストにネストされたデータフレームを結合するためのより良い方法
ネストされたリストを含むリストオブジェクトがあり、それぞれにデータフレームが含まれています。以下のコードは、私のデータ構造をシミュレートしています。
1つのマスターデータフレームを作成するために、すべてのデータフレームを行バインドしようとしています。現在、for
ループを使用してこのアクションを完了しています。
実際には、私のマスターリストは非常に大きく(5ではなく3700の長さ)、for
ループが非常に遅くなります。
同じタスクを完了するためのより速い方法はありますか?
r - 時系列データ操作
私は以前にこの問題を抱えていましたが、解決策を書き留めていなかったので、今また困っています!
私は次のようなデータフレームを持っています:
つまり、日付/製品の組み合わせごとに1行、組み合わせごとに数量と収入の情報があります。
このデータフレームを次のように再配置したいと思います。
つまり、日付ごとに1行、製品/情報(数量、収入)の組み合わせごとに1列にしたいのです。
どうすればこれを達成できますか?前もって感謝します!
r - Rでのデータフレームの再配置
次のようなデータフレームがあります。
次に、月/年で並べ替えます(時間で並べ替え、行の整合性を維持します)。これにより、各月に3つの列が作成され、その月に関連するすべてのデータ(created_at、actor_attributes_email、およびtype)がこれらの3つの列に配置され、次のヘッダーが取得されます(データに存在するすべての月)。
Rでこれをどのように達成できますか?
データセット全体を含むCSVファイルはここにあります: https ://github.com/aronlindberg/VOSS-Sequencing-Toolkit/blob/master/rubinius_rubinius_sequencing/rubinius_6months.csv
dput()
CSVの最初の行は次のとおりです。
他のいくつかの仮定は次のとおりです。
- 「PushEvent」(たとえば)が10回繰り返されても、RパッケージTraMineRを使用して配列分析を行うため、これらすべてを保持する必要があります。
- 列の長さが等しくない場合があります
- 異なる月の列間には関係がありません
- 特定の月内のデータは、最も早い時間で最初に並べ替える必要があります
- たとえば、2011年6月と2012年6月のデータは別々の列に入れる必要があります