ツイートがあり、ハッシュタグの内容を見つける必要があります。正規表現を使用して、「#」で始まり「 」で終わるすべてのものを分離して変数に保存するにはどうすればよいですか? 私はMatLabを使用しています。
1 に答える
5
正規表現に慣れていないと、使用するのが難しい場合があります。
ハッシュタグを見つける方法の 1 つを次に示します。
tweet = 'it is fun to post on #stackoverflow, really';
regexp(tweet,'#(\w+)','tokens','once')
ans =
'stackoverflow'
何をし#(\w+)
ますか?「単語」文字 (スペースも句読点もなし) を で検索し\w
、それらの少なくとも 1 つが必要であることを指定します+
。単語は で始まる必要があり#
ます。括弧を使用して返される部分を示し、オプションをtokens
使用して一致を返すようにします (ハッシュタグがツイートのどこにあるかは気にしません)。1 つのハッシュタグのみを検索するonce
ようにオプションを設定しました。regexp
ツイートに複数のハッシュタグが含まれていることが予想される場合は、これを行わないでください。ただし、出力は文字列のセル配列になることに注意してください。
于 2012-12-11T22:57:34.077 に答える