誰かが助けてくれることを望んでいる質問があります...
Web ページのコンテンツを含む変数があります (WWW::Mechanize を使用してスクレイピング)。
変数には、次のようなデータが含まれます。
$var = "ewrfs sdfdsf cat_dog,horse,rabbit,chicken-pig"
$var = "fdsf iiukui aawwe dffg elephant,MOUSE_RAT,spider,lion-tiger hdsfds jdlkf sdf"
$var = "dsadp poids pewqwe ANTELOPE-GIRAFFE,frOG,fish,crab,kangaROO-KOALA sdfdsf hkew"
上記の例から私が興味を持っている唯一のビットは次のとおりです。
@array = ("cat_dog","horse","rabbit","chicken-pig")
@array = ("elephant","MOUSE_RAT","spider","lion-tiger")
@array = ("ANTELOPE-GIRAFFE","frOG","fish","crab","kangaROO-KOALA")
私が抱えている問題:
変数からカンマ区切りの文字列のみを抽出し、後で使用できるように配列に格納しようとしています。
しかし、カンマで区切られた動物のリストの先頭 (つまり、cat_dog) と末尾 (つまり、chicken-pig) の文字列を確実に取得するための最良の方法は何ですか?
また、変数には Web ページのコンテンツが含まれるため、段落や文でコンマを使用する正しい方法であるため、コンマの直後にスペースが続き、次に別の単語が続く場合もあるのは避けられません...
例えば:
Saturn was long thought to be the only ringed planet, however, this is now known not to be the case.
^ ^
| |
note the spaces here and here
上記のように、コンマの後にスペースが続くケースには興味がありません。
コンマの後にスペースがない場合 (つまり、cat_dog、horse、rabbit、chicken-pig) にのみ関心があります。
これを行う方法をいくつか試しましたが、正規表現を構築するための最良の方法を見つけることができません。