Python で正規表現を使用してページ ソースを検索し、javascript ですべての json 情報を見つけています。具体的な例は次のようになります。
var fooData = { ID: 123456789、 名前:「フーバー」、 country_name: "フー", country_is_eu: null, foo_bars: ヌル、 foo_email: ヌル、 foo_rate: 1.0, foo_id: 0987654321 };
私は正規表現について知っておくべきことをすべて理解するのにかなり慣れていないので、自分がやっていることは正しいかどうか確信が持てません。個々の行をいくつか取得できますが、re.MULTILINE の使用方法が完全にはわかりません。これは私が今持っているコードです:
prog = re.compile('[var ]?\w+ ?= ?{[^.*]+\n};', re.MULTILINE)
vars = prog.findall(text)
なぜこれが機能しないのですか?
より明確にするために、次のようにこれらのブラケットの間のすべてを一致させる必要があります。
var fooData = { };
したがって、基本的に、次のような行を除くすべての行を一致させる方法を理解できません。
};