正規表現を使用してテキストファイルからデータを引き出すことに関連する質問があります。次の形式のテキストファイルがあります。
REPORTING-OWNER:
OWNER DATA:
COMPANY CONFORMED NAME: DOE JOHN
CENTRAL INDEX KEY: 99999999999
FILING VALUES:
FORM TYPE: 4
SEC ACT: 1934 Act
SEC FILE NUMBER: 811-00248
FILM NUMBER: 11530052
MAIL ADDRESS:
STREET 1: 7 ST PAUL STREET
STREET 2: STE 1140
CITY: BALTIMORE
STATE: MD
ZIP: 21202
ISSUER:
COMPANY DATA:
COMPANY CONFORMED NAME: ACME INC
CENTRAL INDEX KEY: 0000002230
IRS NUMBER: 134912740
STATE OF INCORPORATION: MD
FISCAL YEAR END: 1231
BUSINESS ADDRESS:
STREET 1: SEVEN ST PAUL ST STE 1140
CITY: BALTIMORE
STATE: MD
ZIP: 21202
BUSINESS PHONE: 4107525900
MAIL ADDRESS:
STREET 1: 7 ST PAUL STREET SUITE 1140
CITY: BALTIMORE
STATE: MD
ZIP: 21202
所有者の名前(John Doe)と識別子(99999999999)、および会社の名前(ACME Inc)と識別子(0000002230)を別々の変数として保存したいと思います。ただし、ご覧のとおり、変数名(CENTRALINDEXKEYとCOMPANYCONFORMEDNAME)は、両方の情報でまったく同じです。
次のコードを使用して所有者の情報を抽出しましたが、会社のデータを抽出する方法がわかりません。(注:テキストファイル全体を$ dataに読み込みます)。
if($data=~m/^\s*CENTRAL\s*INDEX\s*KEY:\s*(\d*)/m){$cik=$1;}
if($data=~m/^\s*COMPANY\s*CONFORMED\s*NAME:\s*(.*$)/m){$name=$1;}
所有者と会社の両方の情報を抽出する方法について何かアイデアはありますか?
ありがとう!