私pandas
dataframe
は列を持つ を持っています:
クリック値の「動画」と「リンク」
日時のインデックス付き。何らかの理由で、ビデオ シリーズで semilogy と boxplot を使用すると、エラーが発生します。
ValueError: Data has no positive values, and therefore can not be log-scaled.
しかし、「リンク」シリーズでそれを行うと、箱ひげ図を正しく描くことができます。
「ビデオ」シリーズと「リンク」シリーズの両方に NaN 値と正の値があることを確認しました。
なぜこれが起こっているのかについて何か考えはありますか? 以下は、これが事実であることを確認するために私が行ったことです
以下はサンプルコードです。
#get all the not null values of video to show that there are positive
temp=a.types_pivot[a.types_pivot['video'].notnull()]
print temp
#get a count of all the NaN values to show both 'video' and 'link' has NaN
count = 0
for item in a.types_pivot['video']:
if(item.is_integer() == False):
count += 1
#try to draw the plots
print "there is %s nan values in video" % (count)
fig=plt.figure(figsize=(6,6),dpi=50)
ax=fig.add_subplot(111)
ax.semilogy()
plt.boxplot(a.types_pivot['video'].values)
ビデオシリーズのコードからの関連出力は次のとおりです
タイプ リンク ビデオ created_time私が行うことを除いて、まったく同じコードを実行します
2011-02-10 15:00:51+00:00 ナン 5 2011-02-17 17:50:38+00:00 ナン 5 2011-03-22 14:04:56+00:00 ナン 5ビデオには 5463 個の nan 値があります
a.types_pivot['link']
ボックスプロットを描くことができます。
以下は、リンクシリーズからの関連する出力です
インデックス: 5269 エントリ、2011-01-24 20:03:58+00:00 から 2012-06-22 16:56:30+00:00 データ列: リンク 5269 null 以外の値 写真 0 非 null 値 質問 0 非 null 値 status 0 null 以外の値 swf 0 非ヌル値 ビデオ 0 の非 null 値 dtypes: float64(6)リンクには216個のnan値があります
Using the describe function
a.types_pivot['video'].describe()
<pre>
count 22.000000
mean 16.227273
std 15.275040
min 1.000000
25% 5.250000
50% 9.500000
75% 23.000000
max 58.000000
</pre>