2 つの文字列が共有する共通のパターンを識別する (簡単な) 可能性はありますか? 私が言いたいことを明確にするための小さな例を次に示します。
文字列を含む 2 つの変数があります。どちらも同じパターン (「ABC」) といくつかの「ノイズ」を含んでいます。
a <- "xxxxxxxxxxxABCxxxxxxxxxxxx"
b <- "yyyyyyyyyyyyyyyyyyyyyyyABC"
一般的なパターンがわからないので、両方の文字列に「ABC」が含まれていることを R に確認させたいとします。これどうやってするの?
*編集
最初の例は少し単純すぎたかもしれません。これが私の実際のデータの例です。
a <- "DUISBURG-HAMBORNS"
b <- "DUISBURG (-31.7.29)S"
どちらの文字列にも、関数で識別したい「DUISBURG」が含まれています。
*編集
コメントに投稿されたリンクで提案された解決策を採用しました。しかし、私はまだ欲しいものを正確に持っていません。
library(qualV)
LCS(strsplit(a[1], '')[[1]],strsplit(b[1], '')[[1]])$LCS
[1] "D" "U" "I" "S" "B" "U" "R" "G" "-" " " " " "S"
関数が 2 つのベクトルの最長の共通サブシーケンスを探している場合、なぜ の後で停止しないの"D" "U" "I" "S" "B" "U" "R" "G"
ですか? .