成分リストから量と成分を取得するように求められました. リストから数量と成分を正常に抽出しましたが、¼、½ などの半分の文字が発生する場所で立ち往生しています。それらは HTML でエンコードされておらず、正規表現はそこで失敗します。
成分表はこちら
$subject = array("1 teaspoon salt",
"¼ teaspoon black pepper",
"1 cup all-purpose flour",
"1 ½ - 2 cups shredded Parmesan cheese");
正規表現
preg_replace ('/(([0-9][\s+]*[\-]*[0-9]*[\s+]*)(teaspoon|tablespoons|cup|cups)*)([a-z0-9\s]+)/','Quantity: $1 Name: $4',$food)
出力
Quantity: 1 teaspoon Name: salt
¼ teaspoon black pepper (failed)
Quantity: 1 cup Name: all-purpose flour
Quantity: 1 Name: ½ - Quantity: 2 cup Name: s shredded Parmesan cheese (failed)