1

issue # 000...またはissue #000...(数字とポンド記号の間のスペースに注意) を含むものはすべて、その文字列の数字部分に基づいて href urlに置き換えたいと考えています。は...任意の桁数を表します。

## 以下は MWE 文字列です。

News <- readLines(n=5)
CHANGES

* Fixed bug see GitHub issue #12

* Fixed bug see GitHub issue # 111. (John Doe)

News

## これが href url の一部です

## Roots
roota <- "<a href=\"https://github.com/trinker/qdap/issues/"
rootb <- "\">"
rootc <- "</a>"

## これが目的の出力です

c("CHANGES",                                       
    "",                                              
    "* Fixed bug see GitHub <a href=\"https://github.com/trinker/qdap/issues/12\">issue #12</a>" ,             
    "",                                              
    "* Fixed bug see GitHub <a href=\"https://github.com/trinker/qdap/issues/111\">issue #111</a>. (John Doe)"
)

## 断片を抽出する最初の試みは次のとおりです

gsub("(.)(issue)(.[#])(\\s*)([0-9]+)", "\\1", News)

## 貼り付けられそうな数字をつかむ

paste(roota, DIGIT_GRABBED, rootb, "issue #, DIGIT_GRABBED, rootc)

*これには regex タグを付けましたが、R regex は特定の品種であり、回答する場合は R に精通している必要があることに注意してください。

4

1 に答える 1

1

You could simply use:

gsub(pattern="issue *# *([0-9]+)", replacement="<a href=\"https://github.com/trinker/qdap/issues/\\1\">issue #\\1</a>", x=News)
于 2013-09-05T19:15:48.073 に答える