3

私は両方に言及されました:

?URLencode
#and
?curlEscape

どちらの関数も英語ではうまく機能しますが、ヘブライ文字の適切な翻訳を提供できません。

たとえば、単語

שלום

(平和、ヘブライ語)これである必要があります:

%D7%A9%D7%9C%D7%95%D7%9D

しかし、代わりに、両方のコマンドがそれを次のように変換します。

URLencode("שלום")
%f9%ec%e5%ed

何を指示してるんですか?(自分で書くか、事前に作成されたものがあります)

ありがとう、タル

更新:私のsessionInfo:

> sessionInfo()
R version 2.12.0 (2010-10-15)
Platform: i386-pc-mingw32/i386 (32-bit)

locale:
[1] LC_COLLATE=Hebrew_Israel.1255  LC_CTYPE=Hebrew_Israel.1255   
[3] LC_MONETARY=Hebrew_Israel.1255 LC_NUMERIC=C                  
[5] LC_TIME=Hebrew_Israel.1255    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     
4

1 に答える 1

4

URLencodeとcharToRawの両方が私のために機能しているようです...

URLencode( "שלום")
[1] "%d7%a9%d7%9c%d7%95%d7%9d"

URLencodeのソースコードを見る

URLencode
関数(URL、予約済み= FALSE)
{
OK <-paste( "[^-ABCDEFGHIJKLMNOPQRSTUVWXYZ"、
"abcdefghijklmnopqrstuvwxyz0123456789 $ _。+!*'()、"、
if(!reserved)
"; /?:@=&" 、"]"、sep = "")
x <-strsplit(URL、 "")[[1L]]
z <-grep(OK、x)
if(length(z)){
y <-sapply(x [z ]、function(x)paste( "%"、as.character(charToRaw(x))、
sep = ""、collapse = ""))
x [z] <-y
} past
(x、collapse = "")
}

charToRaw( "שלום")
[1] d7 a9 d7 9c d7 95 d7 9d

どのバージョンのRを使用していますか?

これが私のsessionInfo()です

sessionInfo()
Rバージョン2.10.0(2009-10-26)
i386-pc-mingw32

ロケール:
[1] LC_COLLATE = English_United States.1252 LC_CTYPE = English_United States.1252 LC_MONETARY = English_United States.1252
[4] LC_NUMERIC = C LC_TIME = English_United States.1252


添付ベースパッケージ:
[1] stats graphics grDevices utilsdatasetsメソッドbase


その他の添付パッケージ:
[1]名前名

を介してロードされた(添付されていない)preprocessCore_1.8.0:
[1] tools_2.10.0

于 2010-12-06T23:56:14.947 に答える