regex - Rのstri_regexでpropoer情報を抽出するために使用する正規表現はどれですか?

Question

gdac.broadinstitute.org_Rでその文字のこの単語の後に来る名前を抽出しようとしています

element <- "<li><a href=\"gdac.broadinstitute.org_BRCA.miRseq_Preprocess.mage-tab.2015020400.0.0.tar.gz.md5\"> gdac.broadinstitute.org_BRCA.miRseq_Preprocess.mage-tab.2015020400.0.0.tar.gz.md5</a></li>"

stri_extractパッケージから使用してstringiいますが、正規表現についてあまり知らないようです。私はこのようなことを試しました：

stri_extract( element, 
                      regex  = "gdac.broadinstitute.org_")

誰でも助けることができますか？

score 1 · Accepted Answer

に慣れていませんが、簡単にstringi使用gsubできます。名前がどこで終わるかを取得できたので、名前はアンダースコアに続くすべてのものであると仮定します"

gsub(".*gdac.broadinstitute.org_(.*)\".*", "\\1", element)

regex - Rのstri_regexでpropoer情報を抽出するために使用する正規表現はどれですか?

2 に答える 2

Related

Reference