1

ダウンロードしたファイルが読めないのはなぜreadLinesですか?どうすれば読むことができますか?

url="http://www.hkex.com.hk/chi/market/sec_tradinfo/stockcode/eisdeqty_c.htm"
txt=download.file(url,destfile="stock")
> file1=readLines("stock",encoding="big5")
Warning messages:
1: In readLines("stock", encoding = "big5") :
invalid input found on input connection 'stock'
2: In readLines("stock", encoding = "big5") :
incomplete final line found on 'stock'
> file1=readLines("stock",encoding="gbk")
Warning messages:
1: In readLines("stock", encoding = "gbk") :
invalid input found on input connection 'stock'
2: In readLines("stock", encoding = "gbk") :
incomplete final line found on 'stock'
> file1=readLines("stock",encoding="gb2132")
Warning messages:
1: In readLines("stock", encoding = "gb2132") :
invalid input found on input connection 'stock'
2: In readLines("stock", encoding = "gb2132") :
incomplete final line found on 'stock'
> file1=readLines("stock",encoding="gb18030")
Warning messages:
1: In readLines("stock", encoding = "gb18030") :
 invalid input found on input connection 'stock'
2: In readLines("stock", encoding = "gb18030") :
incomplete final line found on 'stock'

ファイルにはコンテンツの一部しか含まれておらず、多くのコンテンツが失われています。なぜですか?

4

1 に答える 1

0

ファイルには 18 行が含まれており、私の R はこれらの 18 行すべてを読み取ります。テキスト ファイルと HTML ファイルの違いを無視しようとしていると思われます。HTML テーブルを抽出するには、次のようなものを使用する必要があります

于 2012-09-06T06:36:38.247 に答える