そのため、非常に長い文字列があり、複数の一致を処理したいと考えています。を使用して最初の試合の最初の位置しか取得できないようですregexpr
。同じ文字列内で複数の位置 (より多くの一致) を取得するにはどうすればよいですか?
HTMLソースコードで特定の文字列を探しています。オークションのタイトル (html タグの間)。それは見つけるのが難しいことを証明しています:
これまでのところ、私はこれを使用しています:
locationstart <- gregexpr("<span class=\"location-name\">", URL)[[1]]+28
locationend <- regexpr("<", substring(URL, locationstart[1], locationend[1] + 100))
substring(URL, locationstart[1], locationstart[1] + locationend - 2)
つまり、タイトルの前の部分を探して、その場所をキャプチャし、そこからタイトルが終了したことを示す「<」を探します。より具体的な提案をお待ちしています。