角かっこ内に含まれるパターンに一致する部分文字列を特定した後、いくつかの文字列を抽出して構築したいと思います。
例: テキストが「2 カップ [9 オンス] [10 g] 小麦粉」の場合
この入力から 4 つの文字列を生成したい:
- 「2杯」→当方
- 「9 オンス」 -> 英国インペリアル
- 「10g」→メートル法
- 「小麦粉」→原材料名
手始めに、oz キーワードを含む角かっこを特定し始め、次のコードを書きましたが、一致しません。これを達成するためのアイデアやベストプラクティスはありますか?
p_oz = re.compile(r'\[(.+) oz\]', re.IGNORECASE) # to match uk metric
text = '2 cups [9 oz] flour'
m = p_oz.match(text)
if m:
found = m.group(1)
print found