17

xlrd を使用して Excel ファイルを読み込もうとしていますが、Excel ファイルで使用されているセルの書式設定を無視して、すべてのデータをテキストとしてインポートする方法があるかどうか疑問に思っています。

これが私がこれまでに使用しているコードです:

import xlrd

xls_file = 'xltest.xls'
xls_workbook = xlrd.open_workbook(xls_file)
xls_sheet = xls_workbook.sheet_by_index(0)

raw_data = [['']*xls_sheet.ncols for _ in range(xls_sheet.nrows)]
raw_str = ''
feild_delim = ','
text_delim = '"'

for rnum in range(xls_sheet.nrows):
    for cnum in range(xls_sheet.ncols):
        raw_data[rnum][cnum] = str(xls_sheet.cell(rnum,cnum).value)

for rnum in range(len(raw_data)):
    for cnum in range(len(raw_data[rnum])):
        if (cnum == len(raw_data[rnum]) - 1):
            feild_delim = '\n'
        else:
            feild_delim = ','
        raw_str += text_delim + raw_data[rnum][cnum] + text_delim + feild_delim

final_csv = open('FINAL.csv', 'w')
final_csv.write(raw_str)
final_csv.close()

このコードは機能しますが、数値としてインポートされる特定のフィールド (郵便番号など) があるため、10 進数のゼロ サフィックスが付きます。たとえば、Excel ファイルに「79854」という郵便番号がある場合、「79854.0」としてインポートされます。

このxlrd 仕様で解決策を見つけようとしましたが、失敗しました。

4

2 に答える 2

24

これは、Excel の整数値が Python では float としてインポートされるためです。したがって、sheet.cell(r,c).valuefloat を返します。値を整数に変換してみてください。ただし、最初にこれらの値が Excel で整数であることを確認してください。

cell = sheet.cell(r,c)
cell_value = cell.value
if cell.ctype in (2,3) and int(cell_value) == cell_value:
    cell_value = int(cell_value)

それすべてxlrd仕様にあります。

于 2010-04-29T20:22:06.043 に答える
4

これは質問の一部ではないことは知っていますが、私はあなたのcsvを取り除き、raw_str直接書きます. 大きなファイル (10,000 行) の場合、これにより時間が大幅に節約されます。

raw_datafor ループを削除して、1 つだけ使用することもできます。

于 2010-05-28T15:36:21.093 に答える