1

私は以下のようなテキストをいくつか持っています。私が望むのは、最後の住所一致を削除することです。問題は、これらの住所の形式がテキストに応じて異なることです:

私はこれを持っています:

To find out more about Groupon Goods, see the <a href="http://www.groupon.co.uk/faq"> FAQ</a>.\n\nUK-Bedding Returns:Albany Mill, Old Hall Street, Middleton, Manchester M241AG UK-Bedding Returns:Albany Mill, Old Hall Street, Middleton Manchester M241AG\n\n<a href="http://www.groupon.co.uk/terms_and_conditions"></a> Built by gskinner.com with Fl

出力は次のようになります (最後の「アルバニー ミル、オールド ホール ストリート、ミドルトン マンチェスター M241AG」は削除しました):

To find out more about Groupon Goods, see the <a href="http://www.groupon.co.uk/faq"> FAQ</a>.\n\nUK-Bedding Returns:Albany Mill, Old Hall Street, Middleton, Manchester M241AG UK-Bedding Returns:\n\n<a href="http://www.groupon.co.uk/terms_and_conditions"></a> Built by gskinner.com with Fl

4

1 に答える 1

1

常に重複がある場合は、別の方法で行います。

  • テキストを新しい行で分割します(複数の新しい行があるため、preg_splitを使用します)。
  • アドレスのある行を見つけます。
  • 半分に切ってください。

したがって、あなたの例では、(余分な冗長)のようなもの:

$lines = preg_split('#\n+#', $text);
$addresses = $lines[1];
$address = substr($addresses, 0, floor(strlen($addresses) / 2));
于 2013-01-03T12:40:33.600 に答える