6

str.contains を使用する場合に相当するものはありますか?

次のコードは、「Sa」が原因で、カテゴリに「Said Business School」を誤ってリストしています。単語境界を作成できれば、問題は解決します。これをめちゃくちゃにした後にスペースを入れます。私はdfsであるパンダを使用しています。正規表現を使用できることは知っていますが、文字列を使用して高速化できるかどうかに興味があります

gprivate_n = ('Co|Inc|Llc|Group|Ltd|Corp|Plc|Sa |Insurance|Ag|As|Media|&|Corporation')
df.loc[df[df.Name.str.contains('{0}'.format(gprivate_n))].index, "Private"] = 1 
4

2 に答える 2