これを投稿して申し訳ありませんが、これに取り組んで多くの時間を費やして失敗しました。したがって、正規表現+ Pythonは、すべての人に挑戦します。
私はほとんど定期的にフォーマットされているデータを扱っています。会社のリストは、次のような文字列に結合されます
`Company Inc,Company, LLC,Company`
エントリを説明するための引用符なし。上記の通常の例を使用すると、次のことができます。
>>> re.split(r',\b', 'Company Inc,Company, LLC,Company')
['Company Inc', 'Company, LLC', 'Company']
残念ながら、一部の文字列は次のように不規則にフォーマットされています。
`IBP, Inc,Tyson Foods,Inc.`
ここで、スペースによって,Inc
分離されていない。Foods
だから、を使用してr',\b'
、私はこれを取得します:
>>> re.split(r',\b', 'IBP, Inc,Tyson Foods,Inc.')
['IBP, Inc', 'Tyson Foods', 'Inc.']
私はこれを手に入れたいです:
['IBP, Inc', 'Tyson Foods,Inc.']
この状況であなたは何をしますか?