6

手書きの文書からスキャンされた文のベクトルがあります。その過程で、次のような間隔の問題が発生しました。

 The d og is br own.

'_x_'スペース-文字-スペースを含む任意のパターンを一般的に取得し、次のように2番目のスペースを折りたたむ方法があるかどうか興味がありました。

The d og is br own.  --> The dog is br own.

スペースの間の1文字だけが気になります('_x_'NOT '_xx_')。

助言がありますか?

4

1 に答える 1

4

多分

> x<-"The d og is br own."
> gsub(" (.) "," \\1",x)
[1] "The dog is br own."

また

gsub(" ([[:alnum:]]) "," \\1",x)

(.)何にでも([[:alnum:]])一致する英数字のみに一致します。

于 2012-07-20T03:02:19.100 に答える