3

Graphlab.SFrame次の列名を持つオブジェクトがあるとします。

>>> import graphlab
>>> sf = graphlab.SFrame.read_csv('some.csv')
>>> s.column_names()
['Dataset', 'Domain', 'Score', 'Sent1', 'Sent2']

たとえば、「スコア」列の NA 値を含む行を削除するには、次のようにします。

>>> sf.dropna('Score')

または、 None 値を特定の値 (-1 としましょう) に置き換えるには、次のようにします。

>>> sf.fillna('Score', -1)

https://dato.com/products/create/docs/generated/graphlab.SFrame.htmlから SFrame ドキュメントを確認した後、特定の列に None を含む行を見つけるための組み込み関数はありません。のようにsf.findna('Score')。というか、見落としていたのかもしれません。

そのような機能がある場合、それは何と呼ばれますか?

NA値を持つ行に指定された列がある行を抽出する方法がない場合はどうすればよいですか?

4

1 に答える 1

2

ブール配列を使用して、特定の列の値が欠落している行を特定できると思います。

>>> import graphlab
>>> sf = graphlab.SFrame({'a': [1, 2, None, 4],
...                       'b': [None, 3, 1, None]})
>>> mask = sf['a'] == None
>>> mask
dtype: int
Rows: 4
[0, 0, 1, 0]
于 2015-12-17T18:25:38.987 に答える