問題タブ [data-science]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
823 参照

algorithm - 名義データのクラスタリング

クラスタリング アルゴリズムをデータ セットに適用しようとしています。私のデータセットは映画のもので、属性の一部は名目上のものです。例えば:

K-means に似たものを適用できますか? たとえば、「ドラマ」を 0、「ホラー」を 1、「コメディ」を 2、「アニメーション」を 3 とラベル付けすると、K-means は距離で機能します。 「ドラマ」は「コメディ」よりも「ホラー」に密接に関連しています (この例では、現実に近いかもしれませんが、一般的なケースでは、言葉を数字としてラベル付けし、実際の比率を維持することは非常に困難です.この問題に対処するアルゴリズムは?

0 投票する
4 に答える
91 参照

python - リスト内包表記のタプルで計算を行う

私はリスト内包表記が初めてで、タプルを使って何かしたいと思っています。これが問題です:

2 つのベクトルl1とが与えられた場合l2、それらをタプルに結合したいと考えています。次に、すべてを合計する前に乗算したいと思います。

たとえば、 と がある場合、それらを zip 関数で結合しl1 = [1,2,3]て.l2 = [4,5,6][(1,4),(2,5),(3,6)]

この後、タプルに 1 を乗算して追加します。となり[(1*4)+1,(2*5)+1,(3*5)+1]、 を与える[4,11,16]

その後、4+11+1631 を与えるリストを合計したいと思います。

tuple(map(operator.add, a, b))どちらがタプルを合計できるかを以前に学びました。しかし、今はもう 1 つ計算を行う必要があるため、どのように開始すればよいかわかりません。リスト内包表記で一行で済むと良いです。誰でもアイデアを得ましたか?

0 投票する
2 に答える
337 参照

r - R sparkTable の書式設定 - 中央のテキスト

Rパッケージ「sparkTable」を使用して、PDFレポートのマークダウンでいくつかのテーブルを作成しています。必要な表とグラフはありますが、表内のテキストを書式設定するための規定がないようです。kable や pander などでは、テキストの配置をフォーマットできますが、sparkTable を使用する方法がないようです。おそらく、これを行うLaTeXの方法がいくつかあります。誰かに何かアイデアがあれば、私は素晴らしいと思います。ありがとう!

0 投票する
2 に答える
214 参照

python - python pandasとmatplotlibのインストールの競合

Mac OSX Yosemite 10.10.5 を使用しており、ラップトップで Python を使用してデータ サイエンスを実践しようとしています。私はvirtualenvでpython 3.5.1を使用していますが、pandasとmatplotlibをインストールすると、インポートしようとすると両方が競合しているように見えます。どちらにも同じエラーがあり、出力は次のとおりです。

0 投票する
6 に答える
121234 参照

python - Kerasでモデルをフィッティングするとき、バッチサイズとエポック数はどれくらいの大きさでなければなりませんか?

私は 970 個のサンプルでトレーニングを行っており、243 個のサンプルで検証しています。

val_accを最適化するためにKerasでモデルをフィッティングするとき、バッチサイズとエポック数はどのくらいの大きさでなければなりませんか? データ入力サイズに基づいて使用する経験則はありますか?

0 投票する
1 に答える
506 参照

python - Kerasでモデルの期待されるパフォーマンスに関するデータを記録する方法は?

最適なモデルをファイル システムに保存するスクリプトを作成し、モデルの予想されるパフォーマンスに関するデータも別のテキスト ファイルに記録するようにします。

現在のコード:

現在、最良のモデルを HDF5 ファイルとして保存しています。Keras を使用して HDF5 ファイルに保存されている最適なモデルのパフォーマンスを別のテキスト ファイルに記録する方法はありますか?

編集:ここでこれを使用する方法はありますかhttp://keras.io/callbacks/ ?

0 投票する
0 に答える
89 参照

machine-learning - 予測子として時間 (年) と緯度と経度を含むデータに勾配ブースティング アルゴリズムを使用できますか?

2005 年から 2014 年までの週ごとの気象情報、利回り、緯度と経度を含むデータがあります。このデータに基づいて、2015 年の収量を予測したいと思います。勾配ブースティング アルゴリズムを使用する予定ですが、場所 (lat-lon) と年も予測因子として考慮しているため、それが正しいアプローチであるかどうかはわかりません。さまざまな年の気象変動を把握できるように、さまざまな年のデータを保持したい

0 投票する
5 に答える
245994 参照

python - KerasでHDF5ファイルからモデルをロードするには?

KerasでHDF5ファイルからモデルをロードするには?

私が試したこと:

上記のコードは、最適なモデルを weights.hdf5 という名前のファイルに正常に保存します。私がやりたいことは、そのモデルをロードすることです。以下のコードは、私がそうしようとした方法を示しています。

これは私が得るエラーです: