3

私はパンダが初めてです。

pandas データフレームに新しい列を追加し、df奇数行ごとに「開始」を割り当て、偶数行ごとに「停止」を割り当てたいと考えています。

ただし、df.iloc[1::2, :] = "Start"そうすると、すべての列に「開始」文字列を含む新しい行が 2 番目ごとに挿入されます。

この場合、パンダは「開始」文字列をどの列に配置するかを認識していません。

ただし、正しい構文を理解できませんでした。

4

1 に答える 1

5

これが私の解決策です-最適化の部分を理解していませんが、かなり大きなデータセットを考えると、これはそれをうまく処理するはずです-

import pandas as pd

df = pd.read_csv('temp.csv')

df['New_Col'] = "Start"

df.loc[1::2,"New_Col"] = "Stop"

print df['New_Col']

出力 -

0      Start
1       Stop
2      Start
3       Stop
4      Start
5       Stop
6      Start
7       Stop
8      Start
9       Stop
10     Start
11      Stop
12     Start
13      Stop
14     Start
15      Stop
16     Start
17      Stop
18     Start
19      Stop
20     Start
21      Stop
22     Start
23      Stop
24     Start
25      Stop
26     Start
27      Stop
28     Start
29      Stop
       ...  
116    Start
117     Stop
118    Start
119     Stop
120    Start
121     Stop
122    Start
123     Stop
124    Start
125     Stop
126    Start
127     Stop
128    Start
129     Stop
130    Start
131     Stop
132    Start
133     Stop
134    Start
135     Stop
136    Start
137     Stop
138    Start
139     Stop
140    Start
141     Stop
142    Start
143     Stop
144    Start
145     Stop
Name: New_Col, dtype: object
于 2016-11-28T04:47:13.993 に答える