1

ツイート内のすべてのハッシュタグを見つけたい。以下のコードはハッシュタグを見つけますが、それらを印刷すると、実際のハッシュタグの代わりに各文字が書き出されます。

問題は、ハッシュタグの各文字のリンクを作成する必要があるため、現在は不可能な、見つかったハッシュタグのリンクを作成したいということです。

私は何を間違っていますか?

tag_regex = re.compile(r"""
       [/^#\S+$/]
       """, re.VERBOSE)

for tag in tag_regex.findall(tweet):
    print tag

結果:

#
h
a
s
h
t
a
g
1
#
h
a
s
h
t
a
g
2
4

1 に答える 1

3

ブラケットは、望ましくない文字クラスを構築します。また、正規表現区切り文字を使用/.../しない言語で使用したくない場合もあります (バックスラッシュをエスケープする必要がないので、単純な文字列で十分です。生の文字列が望ましいです)。最後に、入力文字列の部分文字列を見つけたい場合は、アンカーを使用しないでください。

tag_regex = re.compile(r"#\S+")
于 2013-08-28T11:54:15.680 に答える