0

Qualtrics はかなり人気のある調査プラットフォームです。調査データを CSV ファイルとしてダウンロードできます。Qualtrics CSV ファイルにはいくつかの癖があります。

  1. BOM 文字で始まる
  2. それらには、変数が何であるかを説明する追加の情報行が含まれています
  3. 多くの場合、列名に括弧とピリオドが含まれていました。

次のコードで#1と#2を処理できました:

import pandas as pd
df = pd.read_csv('qualtrics_survey.csv', skiprows=[1], encoding='utf-8-sig')

次のコードを実行すると、括弧とピリオドを含むすべての列のリストが表示されます。

list(df.columns.values)

turk.1 という列があります。ただし、実行できません:

df.turk.1

ファイルをロードする最善の方法がわかりません。かっこをすべて削除し、ピリオドをダッシュ​​などに置き換えても問題ありません。

4

1 に答える 1

4

列を選択するdf['col']代わりに、表記法を使用できます。df.colこのため、実際にはこの表記が好まれます。

それが望ましくない場合はrename、データを読み込んだ後にメソッドで列の名前を変更することもできます。これは手動で行うことができます:

df = df.rename(columns={'turk.1': 'other_name'})

または、たとえば、すべてのピリオドをアンダースコアに置き換える関数を提供します。

df = df.rename(columns=lambda x: x.replace('.', '_'))
于 2014-04-04T19:44:29.273 に答える