regex - Perl Regex、2 つの文字列の間の文字列を取得

Question

私はPerlを初めて使用し、正規表現を使用して、その文字列にあることがわかっている2つのタグ間の文字列を取得しようとしています。私はすでにstackoverflowからさまざまな回答を試しましたが、どれもうまくいかないようです。これが私の例です...

必要なデータは $info 変数にあり、そこから有用なデータを取得したい

my $info = "random text i do not want\n|BIRTH PLACE=Boston, MA\n|more unwanted random text";

上記の文字列の有用なデータはですBoston, MA。によって文字列から改行を削除しました$info =~ s/\n//g;。今$infoこの文字列を持っています"random text i do not want|BIRTH PLACE=Boston, MA|more unwanted random text"。これを行うと、必要なデータを簡単に取得できると思いました。

必要なデータの取得にご協力ください。|BIRTH PLACE=データの前には常にが続き、が続くと確信しています|。その前後はすべて不要なテキストです。このような質問がすでに回答されている場合は、それも案内してください。ありがとう。

score 3 · Accepted Answer

/\|BIRTH PLACE=([^\|]+)\n\|/その周りのすべてを置き換える代わりに、[^\|]+ の 1 つ以上であるを検索できますanything that is not a pipe。

score 2 · Accepted Answer

$info =~ m{\|BIRTH PLACE=(.*?)\|} or die "There is no data in \$info?!";
my $birth_place = $1;

これでうまくいくはずです。

score 1 · Accepted Answer

実際、これらの改行が役に立ったかもしれません。私は次の最初の正規表現に行きました：

/^\|BIRTH PLACE=(.*)$/m

複数行修飾子 ( m) を使用して、文字列の最初と最後で一致させるだけでなく、^行の最初と最後で一致させます。$一体、あなたは本当に夢中になってマッチすることさえできます：

/(?<=^\|BIRTH PLACE=).+$/m

必要な情報だけを取得するには、後読み ( (?<= ... )) を使用して出生地情報であることをアサートします。

1回できるのに、なぜ2回呪うのですか？

したがって、perl では次のようになります。

if ($info =~ m/(?<=^\|BIRTH PLACE=).+$/m) {
    print "Born in $&.\n";
} else {
    print "From parts unknown";
}

score 1 · Accepted Answer

You have presumably read this data from a file, which is a bad start. You program should look like this

use strict;
use warnings;

use autodie;

open my $fh, '<', 'myfile';

my $pob;
while (<$fh>) {
  if (/BIRTH PLACE=(.+)/) {
    $pob = $1;
    last;
  }
}

print $pob;

output

Boston, MA

regex - Perl Regex、2 つの文字列の間の文字列を取得

4 に答える 4

Related

Reference