3

ヘブライ語の列名で .txt ファイルを読み込もうとしていますが、成功しません。

サンプル ファイルを http://www.talgalili.com/files/aa.txtにアップロードしました。

そして、コマンドを試しています:

read.table("http://www.talgalili.com/files/aa.txt", header = T, sep = "\t")

これは私に次のように返します:

  X.....ª X...ª...... X...œ....
1      12          97         6
2     123         354        44
3       6           1         3

それ以外の:

אחת שתיים   שלוש
12  97  6
123 354 44
6   1   3

私の出力:

l10n_info()

は:

$MBCS
[1] FALSE

$`UTF-8`
[1] FALSE

$`Latin-1`
[1] TRUE

$codepage
[1] 1252

そして以下のために:

Sys.getlocale()

は:

[1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252"

ファイルを正しくロードできるようにするには、何を試して変更すればよいか教えていただけますか?

更新: 使用しようとしています:

read.table("http://www.talgalili.com/files/aa.txt",fileEncoding ="iso8859-8")

結果:

 V1
1  ?
Warning messages:
1: In read.table("http://www.talgalili.com/files/aa.txt", fileEncoding = "iso8859-8") :
  invalid input found on input connection 'http://www.talgalili.com/files/aa.txt'
2: In read.table("http://www.talgalili.com/files/aa.txt", fileEncoding = "iso8859-8") :
  incomplete final line found by readTableHeader on 'http://www.talgalili.com/files/aa.txt'

これも試しながら:

Sys.setlocale("LC_ALL", "en_US.UTF-8")

またはこれ:

Sys.setlocale("LC_ALL", "en_US.UTF-8/en_US.UTF-8/C/C/en_US.UTF-8/en_US.UTF-8")

これを入手してください:

[1] ""
Warning message:
In Sys.setlocale("LC_ALL", "en_US.UTF-8") :
  OS reports request to set locale to "en_US.UTF-8" cannot be honored

最後に、ここに > sessionInfo() があります

R version 2.10.1 (2009-12-14) 
i386-pc-mingw32 

locale:
[1] LC_COLLATE=English_United States.1255  LC_CTYPE=English_United States.1252    LC_MONETARY=English_United States.1252 LC_NUMERIC=C                          
[5] LC_TIME=English_United States.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] tools_2.10.1

任意の提案や説明をいただければ幸いです。

ベスト、タル

4

2 に答える 2

5

fileEncodingパラメータを read.table に値を渡してみますiso8859-8

iconvlist()サポートされているエンコーディングのアルファベット順のリストを取得するために使用します。ここで見たように、ヘブライ語は ISO 8859 のパート 8 でなければなりません。

于 2010-03-18T16:14:15.810 に答える