PHPで正規表現を使用して、複数行のテキストボックスに貼り付けられ、処理のためにスクリプトに送信されたフォームレター(もちろん、既知の形式)を「リバースエンジニアリング」する良い例を探しています。
したがって、たとえば、これが元のプレーンテキスト入力(USDAプレスリリースから取得)であると仮定します。
ワシントン、2010年4月5日-ノースダコタ州ニューロックフォードのNorth American Bison Co-Opは、トンシルが完全に除去されていない可能性のある舌を含む約25,000ポンドの牛肉の頭全体をリコールしています。すべての年齢の牛からのトンシルの除去、米国農務省の食品安全検査局(FSIS)は本日発表しました。
わかりやすくするために、変数であるフィールドは以下で強調表示されています。
[pr_city =] WASHINGTON、[pr_date=]2010年4月5日- [corp_name=]North American Bison Co-Op、[corp_city =] New Rockford、 [corp_state =] ND、施設は約[amount=]25,000ポンドをリコールしています[product =]牛肉の頭全体に、トンシルが完全に除去されていない可能性があります。これは、 [理由=]すべての年齢の牛からのトンシルの除去を要求する規制に準拠していません。米国農務省の食品安全および本日発表された検査サービス(FSIS)。
どうすれば効率的にコンテンツを抽出できますか
- pr_city
- pr_date
- corp_name
- corp_city
- corp_state
- 額
- 製品
- 理由
私の例のフィールド?
助けていただければ幸いです、ありがとう。