1

Instagramのメディアキャプションからハッシュタグとユーザーの言及を抽出するためのJavaライブラリまたは正規表現パターンはありますか? 私はtwitter-text apiを知っていますが、スペースのないハッシュタグを処理できません。

4

1 に答える 1

1

これはうまくいくはずです(ここ(^|\s)(#[a-z\d-]+)から入手しました)

いずれにせよ、Instagram API を使用している場合は、それを呼び出したときに、すべてのハッシュタグを提供する結果の一部があります。

  ["data"]=>
  array(14) {
    ["attribution"]=>
    NULL
    ["tags"]=>
    array(3) {
      [0]=>
      string(13) "workingermany"
      [1]=>
      string(18) "trabajarenalemania"
      [2]=>
      string(10) "radeberger"
    }

コメントで要求されているように、韓国語の文字が必要な場合は、次のように正規表現に追加するだけです。必要なアルファベット(^|\s)(#[a-z\p{Hangul}\d-]+) が多いほど、、、、または\p{Hiragana}\p{Katakana}\p{Latin}

于 2016-03-07T09:04:52.543 に答える