0

Pythonでこの正規表現を解析するには?

ここで、効率的な方法で「From」と「date time stamp」の間の文字列「 Miracle workers 」を解析する必要があります。

    s = """
      business hours. Keyword Search: Sales, Operations, Director, Medical, Medical Devices, DME, Respiratory Equipment, Sales Rep, Account Executive, Exec, Business... <br />
             From Miracle Workers - 26 Apr 2012 08:45:15 GMT
          -  View all <a href="http://www.indeed.com/l-Houston,-TX-jobs.html">Houston    jobs</a>
    """

これは私がやっている正規表現です。効率的な正規表現を取得する必要があります。

    regex1 = re.findall('From\ ([A-Za-z\ ]+)\-',s)
     ['Miracle Workers ']

URL から別の文字列を抽出しています。

  s2 = http://www.indeed.com/job/Region-Manager-Field-Sales-at-Covidien-in-Atlanta,-GA-a1a421aabb4d54a7"
  regex2 = re.findall('-in-([A-Za-z-]+),-([A-Z]{2})',str(job.url))[0]

ここでは、('Atlanta', 'GA') のような 2 つのタプルを取得しています。「 Atlanta,GA」を取得する必要があります。

すべての状況で効果的な方法で結果を得るにはどうすればよいでしょうか?

4

1 に答える 1

1

() を使用すると、結果がグループ化されます。このように、findall はタプルを提供します。この正規表現を試してください(グループ化なし):

regexp = '-in-[A-Za-z-]+,-[A-Z]{2}'
于 2012-04-27T14:13:42.007 に答える