「 」のすべてのインスタンスを検索して取得する必要があります# XXX YYY
。別の例としては、「# LOL foo
」または「# HAHALOL omgpls」があります (私の想像力の欠如は残念です :P. 検索ですべてのヒットのテキスト ファイルのインデックスを取得できればこれに基づいてそれはいいでしょう。
テキストファイルで。正規表現で数回試しましたが、うまくいかないようです。
「#」は常にあり、次にスペースがあり、次に長さが不明の文字列がありますが、通常は 5 文字未満です。次に、再びスペースがあり、長さが不明な同じ文字列が再びあります。