問題タブ [data-science]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 3番目の四分位数が私のデータの平均よりも小さいのはなぜですか?
gobというデータセットをRにロードして、便利なsummary
関数を試しました。3番目の四分位数は平均よりも小さいことに注意してください。どうすればいいの?それは私のデータのサイズですか、それともそのようなものですか?
すでに数字パラメーターに大きな値(例:10)を渡そうとしましたが、問題は解決しません。
gob $ 100201.Dの場合、平均は0.0000878ですが、3番目のQuであることに注意してください。=0。
hadoop - ビッグデータとデータマイニングの違いは何ですか?
ウィキペディアが述べているように
データ マイニング プロセスの全体的な目標は、データ セットから情報を抽出し、それを理解可能な構造に変換してさらに使用できるようにすることです。
これはビッグデータとどのように関連していますか? Hadoop は並行してデータ マイニングを行っているというのは正しいでしょうか。
algorithm - 3 つの変数とデータから価格データを生成する
3 つの変数に基づいて価格を生成するアルゴリズムを考え出そうとしています。いくつかのデータからこれを抽出する方法を考え出す必要があります。
たとえば、中古車の価格を計算しようとしています。3 つの変数は次のようになります。
- 車のメーカー (例: ホンダ シビック)
- 車の年式 (例: 2006)
- 走行距離 (200,000 KM)
リスティング サイトから抽出したデータをフィードします。私が持っているデータは、上記とリスト価格と同じです。
ユーザーはメーカー、年、走行距離を選択でき、そのデータに基づいて平均価格が生成されます。
どんなアイデアでも役に立ちます!MySQLデータベースを使用してPHPでこれを作成しています。
本当にありがとう!
machine-learning - ニューラル ネットワークの入力の正規化の利点は何ですか?
ニューラル ネットワークの入力の正規化の利点は何ですか?
勾配が減少することに気付きましたが、本当に良い結果につながるかどうかはわかりません。
r - R : テキスト クラスタリングのグラフ
私は以下のようなデータフレームを持っています、
このx & y軸をdata$Week_No & data$Regionとしてプロットしたいのですが、アクセス、データ、レポートが線としてプロットされます。数値を 10 進値に変換してプロットできますか?、これを達成するためのさまざまな方法を試しましたが、結果は満足のいくものではありません。私はこれを参照し、このグラフを思いつきました
このような種類のグラフィック表現でより良い結果を得ることができますか、これについて私を導いてください、ありがとう
python - matplotlibを使用してPythonでタイムスタンプをプロットするには?
これについてグーグル全体で検索してきましたが、探しているものを正確に見つけることができないようです。
したがって、基本的には 2 つのリストがあります。1 つのリストはタイムスタンプ データで構成され、2 つ目のリストはそれに対応する値で構成されます。
今私の問題は次のとおりです。私のタイムスタンプは次の形式です
では、どの時刻形式が で使用されていmatplotlib
ますか? これをすぐにプロットしようとしましたが、次のようになります。
datetime.datetime.strptime
変換に使えますか?そうでない場合、それを行う他の方法は何ですか?
を適切な形式に変換した後、変換timestamp
された新しいタイムスタンプを対応する値でどのようにプロットすればよいですか?
matplotlib.pyplot.plot(time, data)
メソッドを使用plot_date
してプロットすることはできますか、または使用する必要がありますか?
python - Spark [Python] - Windows でローカル ファイルを読み取る
ローカル ファイルを spark に読み込みたい。私はWindowsを使用しています。次のコマンドを使用しました。
考えられるすべての組み合わせを試しましたが、常に次のエラーまたは非常に類似したエラーが発生します。
私は次のことを試しました:
file:/// と file:// を追加
file:\\ と file:\ を追加中
D:/sample.txt
D:\sample.txt
D:\sample.txt
現在の作業ディレクトリは D:\ で、ファイルは D:\ にあります。
誰でもアイデアはありますか?
また、Windows を使用する場合、コマンド ラインでは常にバックスラッシュを使用しますか? それともディレクトリ専用ですか?
どうもありがとう、コビー
machine-learning - 機械学習の実例?
最近、Coursera で Andrew Ng 教授による Machine Learning コースを受講していました。このコースを受講した後、機械学習アルゴリズムの基本を理解しましたが、次の質問があります。
実際の機械学習のユース ケースの例はどこにありますか?
機械
学習プロジェクトの業界/生産では、どのようなツールまたはフレームワークが使用されていますか?機械学習モデルは本番環境でどのように使用またはデプロイされますか?
データサイエンティストになるには?または、次に何をすればよいですか?
提案、本、コース、またはチュートリアルのリンクは高く評価されます。