regex - re を使用しているときに、Python で "TypeError: expected string or buffer" というエラーが発生するのはなぜですか?

Question

私が犯している小さな間違いはわかりませんが、私が得ていない簡単な解決策がここにあると感じています。ログファイルから、「start」で終わる行だけを読み取ろうとしています。各行には多くの情報があるため、正しいと思われる "(.*)start$" に単純化しました。
文字列の例は次のとおりです。

05/06/2013 12:06:58 AM | null | com.skldfjs : start

import pandas as pd
s=pd.read_csv('Log_file.csv')
s
import re
items=re.findall("(.*)start$",s,re.MULTILINE)

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Anaconda\lib\re.py", line 177, in findall
    return _compile(pattern, flags).findall(string)
<b>TypeError: expected string or buffer</b>

これを修正する方法、またはなぜこれが起こっているのか誰かが知っていますか? ありがとうございました！ケルシー

score 0 · Accepted Answer

このエラーは、pandas.read_csv() が Excel のようなファイルではなく、文字列以外のオブジェクトを返すために発生しています。

私はパンダを使ったことがないので、これ以上の情報を提供することはできません. ただし、pandas が絶対に必要でない場合は、ファイルをプレーンテキストファイルとして読み取ってから、 re.findall() を使用して解析することができます。

with open("file.csv") as f:
    content = f.read()

regex = r"(.*)start$"
items = re.findall(regex, content, re.MULTILINE)

regex - re を使用しているときに、Python で "TypeError: expected string or buffer" というエラーが発生するのはなぜですか?

1 に答える 1

Related

Reference