テキストを解析するスクリプトを書いています。テキストには構造がまったくありません。つまり、抽出しようとしているものには特定の構造がありません。スクリプトは特定の記事の数を見つけるために REGEX を使用する必要があります。
$article ="balls","dolls"
通常の構造 =
- 「3ボール」
- 「2つのボールと6つの人形」
このような正規表現で値を取得できます((\d+)."+$article+"|$)
。これは、数量値が記事の近くにある場合にのみ機能します。
しかし、値がうまくいかない場合、私は何も得られません。例えば。
- 3つのボールと人形または
- 赤玉3個
したがって、これを行う良い方法は、 $article を見つけてから、整数値をルックバックすることだと思います。私はこの正規表現(?=.*"+$article+")([\d\.]+)
を作成しましたが、左の最初の一致を探すだけではできません。助言がありますか。
たくさんありがとう!!!