r - フィールドから類似の文字を削除する

Question

File1.csv には 3000 レコードが含まれているため、住所に関係のない文字を削除する必要があります。

各レコードは「&」または「A/O」から始まります。「Address1」フィールドを消去する必要があります。フィールドに住所関連の情報がない場合は、空のレコードが必要です。

例：

File1.csv:

Address1
&&2340 Clemb Street
&&564 7th Street
&&&10th Street
A/O11th Street
A/ONorth Street
A/O/OSouth Street
A/Ocareof
A/Otttt
A/Oyuyuyu
A/Ouiuiuiuiui
A/O/yuyyuyuyuyugggh 4510th Street
&uhhhhhello 56 11th Street

A/O、A/O/O、A/Ouiuiuiui などを含まない File1 の結果を期待しています。

ファイル 1.csv:

Address1
2340 Clemb Street
564 7th Street
10th Street
11th Street
North Street
South Street
<blank record>
<blank record>
<blank record>
<blank record>
4510th Street
56 11th Street

助けてくれてありがとう！

score 1 · Accepted Answer

より洗練されたマッチングパターンを使用できることはほぼ間違いありませんがgsub()、次のようにすると、このデータセットを使用して作業が完了するようです。

x <- c('&&2340 Clemb Street',
       '&&564 7th Street',
       '&&&10th Street',
       'A/O11th Street',
       'A/ONorth Street',
       'A/O/OSouth Street')

gsub("&|A/O|/O", "", x)
#-----
[1] "2340 Clemb Street" "564 7th Street"    "10th Street"       "11th Street"      
[5] "North Street"      "South Street"

正規表現の紹介はここにあります。

r - フィールドから類似の文字を削除する

1 に答える 1

Related

Reference