-4

ソースコード

HTML = "<title>RUU</title>"
reExtraTitle = re.compile("<title[^>]*>([^<]*)</title>", re.IGNORECASE)
mcTitle = reExtraTitle.match(HTML)
if mcTitle:
    print mcTitle.group()
else:
    print "no Title"

正規表現が役に立ちます

4

1 に答える 1

4

スタックオーバーフローへようこそ。今日、人々は反対票に手厳しいです。申し訳ありません。あなたは英語のネイティブスピーカーではないと思いますよね?

あなたの質問はSSCCEの原則を満たしていますが、あなたが研究に少し光を当てていないことを示しており、実際には適切な質問をしていませんでしたが、あなたが何を求めているかは明らかです. あなたの答えはre module docにあります。これを読む必要があります。

import re最初に、次に変更する必要があります

print mcTitle.group()

print mcTitle.group(1)

他の人が示唆しているように、おそらくregexp を使用する代わりに専用の html パーサーを使用することを検討する必要があります。

于 2012-06-14T13:26:36.550 に答える