0

RでWebサイトを解析すると(システム:R + Debian)、コンソールに出力されたhtmlオブジェクトが不快になります。

ライン間のギャップは広いです。線の間のギャップを狭めるために、どうすればそれを正常にすることができますか?

たぶん、次のコードで同じ出力を見ることができます。

options(encoding="gbk")
library(XML)
baseURL <- "http://www.jb51.net/article/27174.htm"
txt <- readLines(baseURL)
txt

ここに画像の説明を入力してください

4

2 に答える 2

1

興味深いことに、printベクトルを -ing すると、最長の要素によってすべての要素の間隔が決まるようです。

最長の文字列はtxt[374]次のとおりです。私の画面では、19 行かかります。これは、 のすべての要素がtxt19 行を使用して印刷されることを意味し、多くの空白が含まれる可能性があります。

リストを印刷するときはその問題はないので、解決策は次のとおりです。

print(as.list(txt))
于 2012-09-03T12:43:18.447 に答える
0

gsub()スペースを何もないものに置き換えるために使用してみてください。

于 2012-09-03T12:20:20.360 に答える