問題タブ [summarization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 条件に基づいてデータ フレームを要約する
この種のデータセットがあります (ID、V1、V2 はデータ フレームの 3 つの変数です):
IDごとに、V2で値が最大の行を持つ新しいデータフレームが必要です。たとえば、結果は次のようになります。
text - Javaによるテキスト要約のソースコード
私のプロジェクトにはテキスト サマライザーが必要です。Javaにこれのソースコードはありますか? または、自分で作成する必要がある場合、そのテーマに関する本はありますか?
r - ddply を使用してデータフレーム内のクラスの加重平均を取得する方法は?
私はplyrを初めて使用し、クラス内の値の加重平均を取得して、複数の変数のデータフレームを再形成したいと考えています。次のコードを使用すると、x2 などの 1 つの変数に対してこれを行う方法がわかります。
ただし、コードで x と x2 (およびフレーム内の任意の量の変数) の新しいデータ フレームを作成したいと考えています。誰もこれを行う方法を知っていますか? ありがとう
r - 3 次元配列の限界要約
「R ダンプ」形式でデータを出力するシステムを使用しています。たとえば、次のような 3 次元配列を出力する場合があります。
私は R を初めて使用しますが、R を使用してこのデータの限界要約を検査したいと考えています。たとえば、その 3 番目の次元で平均化された平均値の 2x4 テーブルを見たいと思います。
(可能であれば、周辺の要約が 1 つの次元に折りたたまれていることも確認したいと思います。たとえば、4 つの平均値の行で、各平均は私のデータの 2x3 スライスから取得されます。)
私はsummary(obs)
、すべてのディメンションを折りたたんで全体的な統計を表示する方法と、sapply(obs, summary)
どのディメンションも折りたたまずに、個々のデータの「概要」を表示する方法を試しました。
私が求めている機能があると思いますが、見つかりません!
mongodb - Mongo、履歴コレクションで 1 時間ごとに最初のトランザクションのみを選択
私のコレクションには、経時的な為替レートが含まれています。グラフを表示したいのですが、1 時間ごとに 1 つの値だけを知る必要があります。ただし、私のデータははるかに密度が高く、1 秒ごとに 1 レコード程度です。
1 時間に 1 つだけ残すレコードの密度を下げるにはどうすればよいですか。平均は必要ありません。各時間の記録で十分です。
回答ではパフォーマンスを考慮してください。
ありがとうございました。