6

そのため、1 週間前に機械学習クラスで Graphlab を使い始めました。私はまだGraphlabに非常に慣れていないので、APIを読みましたが、探していたソリューションを得ることができませんでした. それで、ここに質問があります。ベッドルーム、バスルーム、平方フィート、郵便番号など、複数の列を持つこのデータがあります。これらは基本的に特徴であり、私の目標は、さまざまな ML アルゴリズムを使用して家の価格を予測することです。さて、私は郵便番号 93038 で住宅の平均価格を見つけることになっています。そこで、私は非常に素朴なので、問題をより小さなビットに分解し、直感を使用することにしました。これは私がこれまでに試したことです。まず、郵便番号 - 93038 の家の価格だけを抽出できるようなフィルターを作成する方法を見つけようとしました。

import graphlab
sf = graphlab.SFrame('home_data.gl')
sf[(sf['zipcode']=='93038')] 

これらは、郵便番号93038のすべての列を表示しましたが、値93038の価格と郵便番号の列のみを表示したい.私は非常に多くの異なる方法を試しましたが、物事を理解できませんでした.

また、郵便番号の値が 93038 の価格の平均を見つけたいとしましょう。

前もって感謝します。

4

4 に答える 4

6

あなたは試すことができます:

import graphlab as gl
sf = gl.SFrame({'price':[1,4,2],'zipcode':['93038','93038','93037']})

# Filtering
filter_sf = sf[(sf['zipcode']=='93038')] 

# Displaying
print filter_sf[['price', 'zipcode']]

# Averaging a column
print filter_sf['price'].mean()
于 2016-06-24T09:08:07.697 に答える
0
mean_by_zip = sales.groupby(key_columns=['zipcode'], 
       operations={'avg': graphlab.aggregate.MEAN('price')})

mean_by_zip.sort('avg', ascending=False)[0:3] # will give top 3
于 2016-12-18T03:33:57.440 に答える