問題タブ [data-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
data-analysis - Excelのようなビッグデータのデータ分析サービス
ビッグ データ セットを分析し、Excel のようにグラフィックをプロットする Web サービスはありますか? シンプルで効率的で、Web GUI を備えたものが必要です。
data-visualization - データ可視化アルゴリズムの本
データビジュアライゼーションに関する優れた本を購入しようと考えており、ここであなたのおすすめを知りたいです。私のバックグラウンドは数学で、現在、雇用主のためにデータ分析ツールに取り組んでいます。今まで気になった本は2冊
Tufte による定量情報の視覚的表示
インタラクティブなデータ視覚化: ワードによる基礎、テクニック、およびアプリケーション
私は、データを分析するためのアルゴリズムと効率的な方法にもっと興味があります。このサイトにあるようなグラフの作り方を説明した本が欲しいです。
php - 同義語検索アルゴリズム
長い説明よりも例の方がはるかに優れていると思います:)
配列の配列があるとしましょう:
各行には、同義語である文字列が含まれています。そして、この配列の処理の結果として、私はこれを取得したい:
そのため、一種の再帰アルゴリズムが必要だと思います。プログラミング言語は実際には問題ではありません — 一般的なアイデアについて少しだけ助けが必要です。私はphpまたはpythonを使用するつもりです。
ありがとうございました!
matlab - Matlab相互相関と相関係数の質問
私は C++ でプログラムを書いていますが、相互相関を含む matlab のデータを使用しています。2 セットのデータに対して相関を行うと、それらが関連しているかどうかを示す単一の相関係数番号が得られることを理解しています。しかし、データ系列で相互相関を使用したいと考えています。Matlabで相互相関を実行すると、多くのデータが得られ、プロットすると三角形のように見えます...相関は+/- 1の間のどこかにあるはずですが、三角形の先端に向かうデータはそうではありません' t が同時に上がるなど。相互相関が私に与えているものと混乱していますか、それとも、相互相関が実際に各ポイント s(t)、p(t) の相関係数を与えるデータですか? 明確にするための助けをいただければ幸いです。
編集1(フォノンの応答後)
私の主な質問は次のとおりです。2 つのデータ系列を相互に相関させたときに得られるデータは、各ポイントの相関係数ですか。たとえば、(0,10) と (0,8) です。x=0 でこれらの 2 つのプロットの相関係数を取得しているデータはありますか?
math - 相互相関と相関係数に関する質問
重複の可能性:
Matlab相互相関と相関係数の質問
a
MATLABで2 つのデータ セットb
(それぞれ 73 ポイントの長さ)を相互に関連付けてグラフにすると、145 ポイントの三角形のように表示されます。+/- 1 の範囲の相互相関出力をプロットすると、相関係数と三角形のようなグラフの間で混乱します。
compiler-construction - F# コンパイラのドキュメントと F# データ フロー分析ライブラリ
2 つの質問があります。
誰かがF#コンパイラのドキュメントまたは関連リソースを知っているかどうか疑問に思っていました(コンパイラのソースコード自体を除いて、私は現在それを探しています)木が役に立ちます。
また、データ フロー解析用の F# ライブラリも必要です。
ありがとう :)
c++ - SQLの代わりにC++を使用する必要があるのはいつですか?
私はC++プログラマーであり、MySQLを使用してデータベースを操作することがありますが、SQLに関する知識はかなり限られています。しかし、私は確かにそれを変えたいと思っています。
現在、SQLクエリのみを使用してデータベースにあるデータの分析(!)を実行しようとしています。しかし、私はあきらめようとしており、代わりにデータをC ++にインポートし、C++コードで分析を行います。
私はこれについて同僚と話し合いましたが、SQLは複雑な分析ではなく、主に(既存のテーブルからの)データのインポートと(新しいテーブルへの)エクスポート、およびもう少し多くのことを目的としていると言って、C++の使用を促しています。データを結合されたテーブルにマージするなど。
誰かが私に線を引くのを手伝ってもらえますか?だから私はいつC++に切り替えるべきか知っていますか?もちろん、パフォーマンスも問題です。
SQLで物事が複雑になる兆候は何ですか?あるいは、クエリの設計で間違ったアプローチを取っているだけかもしれません。それでは、より良いアプローチを取るためのチュートリアル、本、...をどこで見つけることができますか?
これが曖昧すぎないことを願っています。私は本当に少し迷っています。
google-analytics - Web メトリクス アプリが訪問者のサイト滞在時間を計算する最適な方法は何ですか?
私は Google アナリティクスのような内部 Web 分析システムを開発していますpage stay time
。
- ユーザーがタイムスタンプ: t1 でページ A にアクセスしました
- ユーザーがタイムスタンプ t2 でページ B にアクセス (t2 > t1)
A のページ滞在時間は t2 - t1 で、B は 0 です。
私の質問は次のとおりです。このシナリオでは、page stay time
B を計算するときに、ユーザーがページ A からページ B をクリックしたかどうかを確認する必要がありますか? つまり、B の参照は A ですか?
python - プロットの軸値の変更
1つの軸のデータを変更するにはどうすればよいですか?
私はいくつかのデータでいくつかのスペクトル分析を行っており、私のx軸はいくつかの行列のインデックスです。x軸がデータそのものになるように変更したいのですが。
imshow()を使用してデータをプロットしています(要素がある程度の強度である行列があり、y軸は検出器とソースの対応するペアであり、x軸は周波数である必要があります)。
そのためのコードはここに書かれています:
ある配列のインデックスをその値と交換する方法があれば、私の問題は解決すると思います。
私はなんとかその線を使うことができましたlocs, labels = xticks(find(b[1]), b[1])
。しかし、私のグラフでは、軸の間隔が正しくありません... MaxNLocator(ティック数を減らすために使用したもの)と関係があると思います。
また、xlimを使用すると、図を希望どおりに設定できますが、x軸は同じです(そのxlimでは、元のデータを使用して正しく設定する必要がありました)。
私は何が間違っているのですか?