問題タブ [data-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
5874 参照

sql-server - DataTable をデータベースに保存する

こんにちは、Web サービスから DataTable を生成しています。DataTable 全体を 1 つのデータベース テーブルに保存したいと考えています。

DataTableは生成されていますが、次に何をすべきか.私は立ち往生しています.いくつかの構文を見せてください.そこにも選択ステートメントは本当に必要ありません.DataTable からのすべての情報を空白の db テーブルに挿入したいだけです.

0 投票する
2 に答える
1776 参照

analysis - たとえば、非常に大規模な病院の既存のシステムを理解するには、どのようなプロセスを踏む必要がありますか?

私は、三次病院の既存のシステムを調査して文書化するように依頼されました。病院は、管理部門 (アカウント、管理、エンジニアリングなど) と診療部門 (薬局、患者が病院に出入りするプロセスなど) で構成されています。

データがどのように出入りするか、およびビジネス プロセスを理解する必要があります。

大きな病院です。このシステムを体系的に分析して文書化するにはどうすればよいですか?

私はこの仕事をしていますが、病院に実装できる一般的なシステムを持っており、調査結果から病院のニーズに合わせてシステムを調整したいと考えています。

このプロセスを成功させるには、他の計画が必要です。誰かガイドを手伝ってくれませんか?

編集#1:

この役立つリンクを見つけました

ビジネス プロセス ワークフローを定義して概要を説明する方法

編集#2:

最初に必要だと思われるいくつかの質問を思いつきました。それらに貢献し、挑戦してください。

  • あなたの部署はどのような機能を果たしていますか?
  • あなたの部署にはどのような情報が入りますか?
  • あなたの部署からどのような情報が送られてきますか?
  • 入ってくるそれぞれの情報をどのように使用しますか?
  • あなたはそれらをどうしますか?
  • それらはどのように流れますか?
  • 部門を離れた情報はどのように生成または取得されますか?
  • それぞれの情報はどのように流れますか?
  • どのような情報を生成しますか?
  • 生成されたこれらの情報をどうしますか?
0 投票する
1 に答える
1619 参照

excel - エクセルでの二値化

Excel で 5 つのカテゴリ値を持つ属性の 2 値化をどのように実行しますか?

0 投票する
12 に答える
73017 参照

r - RとSPSSの違い

まもなく膨大な量のネットワーク トラフィック関連データを分析し、分析のためにデータを前処理します。R と SPSS は、統計分析の最も一般的なツールの 1 つです。また、非常に多くのグラフやチャートを生成します。したがって、これら 2 つのソフトウェアの基本的な違いは何だろうと考えていました。

どちらが優れているかを尋ねているわけではありませんが、2 つのワークフローの違いを知りたかっただけです (SPSS には GUI があるという事実以外に)。とにかく、どちらの場合でも主にスクリプトで作業するので、他の違いについて知りたいと思いました。

0 投票する
5 に答える
154846 参照

r - Rのデータへの多項式モデルの当てはめ

この質問に対する回答を読みましたが、非常に役に立ちますが、助けが必要です。

次のように、Rにサンプルデータセットがあります。

モデルをこれらのデータに当てはめたいので、y = f(x). 3次多項式モデルにしたい。

Rでそれを行うにはどうすればよいですか?

さらに、R は最適なモデルを見つけるのに役立ちますか?

0 投票する
2 に答える
817 参照

parsing - 半構造化データの解析-分類子を使用できますか?

半規則的な形式のドキュメントのセットがあります。行は通常、改行文字で区切られ、各行の主要コンポーネントはスペースで区切られます。いくつかの例は、家具の組み立て手順のセット、目次のセット、レシピのセット、および銀行取引明細書のセットです。

問題は、各セットの各標本が、正規表現の解析を実行不可能にする方法でピアメンバーと異なることです。アイテムの数量がアイテム名の前後に来る可能性があり、同じアイテムが標本間で異なる名前を持つ可能性があります。行の間にメモが存在する場合などがあります。

分類子(ニューラルネット、ベイジアン、GA、GP)を使用して、ドキュメント全体またはデータセットを処理しましたが、ドキュメントからアイテムを抽出してコンテキスト内で分類することはしませんでした。これはできますか?より実行可能なアプローチはありますか?

0 投票する
8 に答える
8676 参照

perl - Perl での複数行データの解析

分析する必要があるデータがいくつかあります。データは複数行あり、各ブロックは改行で区切られています。だから、それはこのようなものです

特定のプロパティが存在するデータ ブロックを除外する必要があります。たとえば、プロパティ 4 を持つブロックのみ、プロパティ 3 と 6 の両方を持つブロックのみなどです。これらのプロパティの値に基づいて選択する必要がある場合もあります。たとえば、プロパティ 3 とその値を持つブロックのみが 'アン。

Perlでこれを行うにはどうすればよいですか。「\n」で分割してみましたが、うまくいきません。何か不足していますか?

0 投票する
3 に答える
33210 参照

r - データの確率密度の取得

DSL 回線のインターネット セッションに関するデータを分析する必要があります。セッション期間がどのように分布しているかを確認したかったのです。これを行う簡単な方法は、すべてのセッションの持続時間の確率密度プロットを作成することから始めることだと思いました。

Rにデータをロードし、density()関数を使用しました。というわけで、こんな感じでした

私はRとこの種の分析が初めてです。これは、グーグルを調べて見つけたものです。プロットを手に入れましたが、いくつか疑問が残りました。これは私がやろうとしていることを行うための正しい機能ですか、それとも他に何かありますか?

プロットでは、Y 軸のスケールが 0 ~ 1.5 であることがわかりました。どうすれば 1.5 になるのかわかりません。0 から 1 にすべきではありませんか?

また、より滑らかな曲線を取得したいと思います。データセットが非常に大きいため、線がギザギザになっています。これを提示するときは、それらを滑らかにした方がいいでしょう。どうすればそれを行うことができますか?

0 投票する
5 に答える
4404 参照

python - R/python と SSD を使用したデータ分析

ソリッドステートドライブに保存されたデータで r/python を使用した経験がある人はいますか? 主に読み取りを行っている場合、理論的には、これにより大規模なデータセットの読み込み時間が大幅に改善されるはずです。これが本当かどうか、データ集約型アプリケーションの IO レートを向上させるために SSD に投資する価値があるかどうかを知りたいです。

0 投票する
1 に答える
3378 参照

testing - k-meansの実装をどのようにテストしますか?

多次元データセットの独自のk-means実装をどのようにテストしますか?

データに対して既存の実装(つまりMatlab)を実行し、その結果をアルゴリズムと比較することを考えていました。ただし、これには両方のアルゴリズムがほぼ同じように機能する必要があり、2つの結果間のマッピングはおそらく簡単ではありません。

もっといいアイデアはありますか?