Instagramのメディアキャプションからハッシュタグとユーザーの言及を抽出するためのJavaライブラリまたは正規表現パターンはありますか? 私はtwitter-text apiを知っていますが、スペースのないハッシュタグを処理できません。
1460 次
1 に答える
1
これはうまくいくはずです(ここ(^|\s)(#[a-z\d-]+)
から入手しました)
いずれにせよ、Instagram API を使用している場合は、それを呼び出したときに、すべてのハッシュタグを提供する結果の一部があります。
["data"]=>
array(14) {
["attribution"]=>
NULL
["tags"]=>
array(3) {
[0]=>
string(13) "workingermany"
[1]=>
string(18) "trabajarenalemania"
[2]=>
string(10) "radeberger"
}
コメントで要求されているように、韓国語の文字が必要な場合は、次のように正規表現に追加するだけです。必要なアルファベット(^|\s)(#[a-z\p{Hangul}\d-]+)
が多いほど、、、、または\p{Hiragana}
\p{Katakana}
\p{Latin}
于 2016-03-07T09:04:52.543 に答える