Facebook のハッシュタグ スクレーパーを作成しています。ハッシュタグを取得するために遭遇するすべての正規表現には、英数字だけでなく句読点も含まれているようです。これが私が望むものの例です:
こんにちは世界!私は #fac_book スクレーパー #m4king で、素敵な正規表現が欲しいです。
world
、m4king
、fac
と一致させexpression
たい (スペースを含む句読点に達した場合は切り捨てたいことに注意してください)。ハッシュ記号が含まれていなければいいのですが、それほど重要ではありません。
念のため、Ruby の文字列スキャン メソッドを使用して複数のタグを取得します。
よろしくお願いします!