私はいつも、他の人のスタートアッププロファイルファイルが言語について有用で有益であることに気づきました。さらに、 BashとVimにはいくつかのカスタマイズがありますが、Rには何もありません。
たとえば、私が常に望んでいたことの1つは、ウィンドウターミナルの入力テキストと出力テキストの色を変えたり、構文を強調表示したりすることです。
これが私のものです。色付けには役立ちませんが、ESSとEmacsから取得します...
options("width"=160) # wide display with multiple monitors
options("digits.secs"=3) # show sub-second time stamps
r <- getOption("repos") # hard code the US repo for CRAN
r["CRAN"] <- "http://cran.us.r-project.org"
options(repos = r)
rm(r)
## put something this is your .Rprofile to customize the defaults
setHook(packageEvent("grDevices", "onLoad"),
function(...) grDevices::X11.options(width=8, height=8,
xpos=0, pointsize=10,
#type="nbcairo")) # Cairo device
#type="cairo")) # other Cairo dev
type="xlib")) # old default
## from the AER book by Zeileis and Kleiber
options(prompt="R> ", digits=4, show.signif.stars=FALSE)
options("pdfviewer"="okular") # on Linux, use okular as the pdf viewer
毎回「head」、「summary」、「names」という単語をすべて入力するのは嫌いなので、エイリアスを使用します。
エイリアスを .Rprofile ファイルに入れることはできますが、関数へのフル パスを使用する必要があります (例: utils::head)。そうしないと機能しません。
# aliases
s <- base::summary
h <- utils::head
n <- base::names
編集:あなたの質問に答えるために、coloroutパッケージを使用して端末に異なる色を持たせることができます。涼しい!:-)
options(stringsAsFactors=FALSE)
私の .Rprofile には実際にはありませんが、共著者のコードが壊れる可能性があるため、これがデフォルトであってほしいと思います。なんで?
1) 文字ベクトルはメモリの使用量が少なくなります (ただし、かろうじて)。
2) さらに重要なことは、次のような問題を回避することです。
> x <- factor(c("a","b","c"))
> x
[1] a b c
Levels: a b c
> x <- c(x, "d")
> x
[1] "1" "2" "3" "d"
と
> x <- factor(c("a","b","c"))
> x[1:2] <- c("c", "d")
Warning message:
In `[<-.factor`(`*tmp*`, 1:2, value = c("c", "d")) :
invalid factor level, NAs generated
因子は、必要な場合 (グラフでの順序付けの実装など) には優れていますが、ほとんどの場合は面倒です。
R コマンドの履歴を保存して、R を実行するたびに利用できるようにするのが好きです。
シェルまたは .bashrc で:
export R_HISTFILE=~/.Rhistory
.Rprofile:
.Last <- function() {
if (!any(commandArgs()=='--no-readline') && interactive()){
require(utils)
try(savehistory(Sys.getenv("R_HISTFILE")))
}
}
これが私のものです。私は常にメインの cran リポジトリを使用し、開発中のパッケージ コードを簡単に入手できるようにするコードを用意しています。
.First <- function() {
library(graphics)
options("repos" = c(CRAN = "http://cran.r-project.org/"))
options("device" = "quartz")
}
packages <- list(
"describedisplay" = "~/ggobi/describedisplay",
"linval" = "~/ggobi/linval",
"ggplot2" = "~/documents/ggplot/ggplot",
"qtpaint" = "~/documents/cranvas/qtpaint",
"tourr" = "~/documents/tour/tourr",
"tourrgui" = "~/documents/tour/tourr-gui",
"prodplot" = "~/documents/categorical-grammar"
)
l <- function(pkg) {
pkg <- tolower(deparse(substitute(pkg)))
if (is.null(packages[[pkg]])) {
path <- file.path("~/documents", pkg, pkg)
} else {
path <- packages[pkg]
}
source(file.path(path, "load.r"))
}
test <- function(path) {
path <- deparse(substitute(path))
source(file.path("~/documents", path, path, "test.r"))
}
Windows での作業に便利な 2 つの関数を次に示します。
\
最初はs を に変換し/
ます。
.repath <- function() {
cat('Paste windows file path and hit RETURN twice')
x <- scan(what = "")
xa <- gsub('\\\\', '/', x)
writeClipboard(paste(xa, collapse=" "))
cat('Here\'s your de-windowsified path. (It\'s also on the clipboard.)\n', xa, '\n')
}
2 つ目は、作業ディレクトリを新しいエクスプローラ ウィンドウで開きます。
getw <- function() {
suppressWarnings(shell(paste("explorer", gsub('/', '\\\\', getwd()))))
}
COLUMNS 環境変数 (Linux の場合) から読み取ろうとする、端末全体の幅を使用するためのより動的なトリックがあります。
tryCatch(
{options(
width = as.integer(Sys.getenv("COLUMNS")))},
error = function(err) {
write("Can't get your terminal width. Put ``export COLUMNS'' in your \
.bashrc. Or something. Setting width to 120 chars",
stderr());
options(width=120)}
)
このようにして、端末ウィンドウのサイズを変更しても、R は全幅を使用します。
これが私の〜/ .Rprofileからのもので、MacとLinux用に設計されています。
これらにより、エラーが見やすくなります。
options(showWarnCalls=T, showErrorCalls=T)
私はCRANメニューの選択が嫌いなので、良いものに設定してください。
options(repos=c("http://cran.cnr.Berkeley.edu","http://cran.stat.ucla.edu"))
もっと歴史!
Sys.setenv(R_HISTSIZE='100000')
以下は、ターミナルからMac OSXで実行するためのものです(R.appの方が安定しており、ディレクトリごとに作業を整理できるため、R.appを強くお勧めします。また、適切な〜/ .inputrcを取得してください)。デフォルトでは、X11ディスプレイが表示されますが、見栄えはよくありません。これにより、代わりにGUIと同じクォーツディスプレイが表示されます。このif
ステートメントは、MacのターミナルからRを実行している場合に当てはまるはずです。
f = pipe("uname")
if (.Platform$GUI == "X11" && readLines(f)=="Darwin") {
# http://www.rforge.net/CarbonEL/
library("grDevices")
library("CarbonEL")
options(device='quartz')
Sys.unsetenv("DISPLAY")
}
close(f); rm(f)
そして、いくつかのライブラリをプリロードします。
library(plyr)
library(stringr)
library(RColorBrewer)
if (file.exists("~/util.r")) {
source("~/util.r")
}
ここで、util.rは、流動的な状態で使用するランダムなバッグです。
また、他の人がコンソールの幅について言及していたので、これが私のやり方です。
if ( (numcol <-Sys.getenv("COLUMNS")) != "") {
numcol = as.integer(numcol)
options(width= numcol - 1)
} else if (system("stty -a &>/dev/null") == 0) {
# mac specific? probably bad in the R GUI too.
numcol = as.integer(sub(".* ([0-9]+) column.*", "\\1", system("stty -a", intern=T)[1]))
if (numcol > 0)
options(width= numcol - 1 )
}
rm(numcol)
.Rprofile
ターミナルウィンドウのサイズを変更するたびに再実行する必要があるため、これは実際には含まれていません。私はそれを持っています、util.r
そして私はそれを必要に応じて調達します。
私の個人的な関数とロードされたライブラリのほとんどはRfunctions.rスクリプトにあります
source("c:\\data\\rprojects\\functions\\Rfunctions.r")
.First <- function(){
cat("\n Rrrr! The statistics program for Pirates !\n\n")
}
.Last <- function(){
cat("\n Rrrr! Avast Ye, YO HO!\n\n")
}
#===============================================================
# Tinn-R: necessary packages
#===============================================================
library(utils)
necessary = c('svIDE', 'svIO', 'svSocket', 'R2HTML')
if(!all(necessary %in% installed.packages()[, 'Package']))
install.packages(c('SciViews', 'R2HTML'), dep = T)
options(IDE = 'C:/Tinn-R/bin/Tinn-R.exe')
options(use.DDE = T)
library(svIDE)
library(svIO)
library(svSocket)
library(R2HTML)
guiDDEInstall()
shell(paste("mkdir C:\\data\\rplots\\plottemp", gsub('-','',Sys.Date()), sep=""))
pldir <- paste("C:\\data\\rplots\\plottemp", gsub('-','',Sys.Date()), sep="")
plot.str <-c('savePlot(paste(pldir,script,"\\BeachSurveyFreq.pdf",sep=""),type="pdf")')
これが私のものです:
.First <- function () {
options(device="quartz")
}
.Last <- function () {
if (!any(commandArgs() == '--no-readline') && interactive()) {
require(utils)
try(savehistory(Sys.getenv("R_HISTFILE")))
}
}
# Slightly more flexible than as.Date
# my.as.Date("2009-01-01") == my.as.Date(2009, 1, 1) == as.Date("2009-01-01")
my.as.Date <- function (a, b=NULL, c=NULL, ...) {
if (class(a) != "character")
return (as.Date(sprintf("%d-%02d-%02d", a, b, c)))
else
return (as.Date(a))
}
# Some useful aliases
cd <- setwd
pwd <- getwd
lss <- dir
asd <- my.as.Date # examples: asd("2009-01-01") == asd(2009, 1, 1) == as.Date("2009-01-01")
last <- function (x, n=1, ...) tail(x, n=n, ...)
# Set proxy for all web requests
Sys.setenv(http_proxy="http://192.168.0.200:80/")
# Search RPATH for file <fn>. If found, return full path to it
search.path <- function(fn,
paths = strsplit(chartr("\\", "/", Sys.getenv("RPATH")), split =
switch(.Platform$OS.type, windows = ";", ":"))[[1]]) {
for(d in paths)
if (file.exists(f <- file.path(d, fn)))
return(f)
return(NULL)
}
# If loading in an environment that doesn't respect my RPATH environment
# variable, set it here
if (Sys.getenv("RPATH") == "") {
Sys.setenv(RPATH=file.path(path.expand("~"), "Library", "R", "source"))
}
# Load commonly used functions
if (interactive())
source(search.path("afazio.r"))
# If no R_HISTFILE environment variable, set default
if (Sys.getenv("R_HISTFILE") == "") {
Sys.setenv(R_HISTFILE=file.path("~", ".Rhistory"))
}
# Override q() to not save by default.
# Same as saying q("no")
q <- function (save="no", ...) {
quit(save=save, ...)
}
# ---------- My Environments ----------
#
# Rather than starting R from within different directories, I prefer to
# switch my "environment" easily with these functions. An "environment" is
# simply a directory that contains analysis of a particular topic.
# Example usage:
# > load.env("markets") # Load US equity markets analysis environment
# > # ... edit some .r files in my environment
# > reload() # Re-source .r/.R files in my environment
#
# On next startup of R, I will automatically be placed into the last
# environment I entered
# My current environment
.curr.env = NULL
# File contains name of the last environment I entered
.last.env.file = file.path(path.expand("~"), ".Rlastenv")
# Parent directory where all of my "environment"s are contained
.parent.env.dir = file.path(path.expand("~"), "Analysis")
# Create parent directory if it doesn't already exist
if (!file.exists(.parent.env.dir))
dir.create(.parent.env.dir)
load.env <- function (string, save=TRUE) {
# Load all .r/.R files in <.parent.env.dir>/<string>/
cd(file.path(.parent.env.dir, string))
for (file in lss()) {
if (substr(file, nchar(file)-1, nchar(file)+1) %in% c(".r", ".R"))
source(file)
}
.curr.env <<- string
# Save current environment name to file
if (save == TRUE) writeLines(.curr.env, .last.env.file)
# Let user know environment switch was successful
print (paste(" -- in ", string, " environment -- "))
}
# "reload" current environment.
reload <- resource <- function () {
if (!is.null(.curr.env))
load.env(.curr.env, save=FALSE)
else
print (" -- not in environment -- ")
}
# On startup, go straight to the environment I was last working in
if (interactive() && file.exists(.last.env.file)) {
load.env(readLines(.last.env.file))
}
data.framesを「head」のように表示します。「head」と入力する必要はありません。
print.data.frame <- function(df) {
if (nrow(df) > 10) {
base::print.data.frame(head(df, 5))
cat("----\n")
base::print.data.frame(tail(df, 5))
} else {
base::print.data.frame(df)
}
}
sink(file = 'R.log', split=T)
options(scipen=5)
.ls.objects <- function (pos = 1, pattern, order.by = "Size", decreasing=TRUE, head = TRUE, n = 10) {
# based on postings by Petr Pikal and David Hinds to the r-help list in 2004
# modified by: Dirk Eddelbuettel (http://stackoverflow.com/questions/1358003/tricks-to- manage-the-available-memory-in-an-r-session)
# I then gave it a few tweaks (show size as megabytes and use defaults that I like)
# a data frame of the objects and their associated storage needs.
napply <- function(names, fn) sapply(names, function(x)
fn(get(x, pos = pos)))
names <- ls(pos = pos, pattern = pattern)
obj.class <- napply(names, function(x) as.character(class(x))[1])
obj.mode <- napply(names, mode)
obj.type <- ifelse(is.na(obj.class), obj.mode, obj.class)
obj.size <- napply(names, object.size) / 10^6 # megabytes
obj.dim <- t(napply(names, function(x)
as.numeric(dim(x))[1:2]))
vec <- is.na(obj.dim)[, 1] & (obj.type != "function")
obj.dim[vec, 1] <- napply(names, length)[vec]
out <- data.frame(obj.type, obj.size, obj.dim)
names(out) <- c("Type", "Size", "Rows", "Columns")
out <- out[order(out[[order.by]], decreasing=decreasing), ]
if (head)
out <- head(out, n)
out
}
呼び出す必要がある一連のデバッグ呼び出しが頻繁にあり、それらのコメントを解除するのは非常に面倒です。SOコミュニティの助けを借りて、私は次の解決策に行き、これを私の.Rprofile.site
. # BROWSER
Eclipse タスク用にあるので、[タスク ビュー] ウィンドウでブラウザー呼び出しの概要を確認できます。
# turn debugging on or off
# place "browser(expr = isTRUE(getOption("debug"))) # BROWSER" in your function
# and turn debugging on or off by bugon() or bugoff()
bugon <- function() options("debug" = TRUE)
bugoff <- function() options("debug" = FALSE) #pun intended
私はあまり派手ではありません:
# So the mac gui can find latex
Sys.setenv("PATH" = paste(Sys.getenv("PATH"),"/usr/texbin",sep=":"))
#Use last(x) instead of x[length(x)], works on matrices too
last <- function(x) { tail(x, n = 1) }
#For tikzDevice caching
options( tikzMetricsDictionary='/Users/cameron/.tikzMetricsDictionary' )
setwd("C://path//to//my//prefered//working//directory")
library("ggplot2")
library("RMySQL")
library("foreign")
answer <- readline("What database would you like to connect to? ")
con <- dbConnect(MySQL(),user="root",password="mypass", dbname=answer)
私は mysql データベースから多くの作業を行っているので、すぐに接続できるのは天の恵みです。利用可能なデータベースをリストする方法があればいいのにと思います。そうすれば、さまざまな名前をすべて覚える必要がなくなります。
.Rprofiles に関するStephen Turner の投稿には、いくつかの便利なエイリアスとスターター関数があります。
私は彼の ht と hh を頻繁に使用していることに気づきました。
#ht==headtail, i.e., show the first and last 10 items of an object
ht <- function(d) rbind(head(d,10),tail(d,10))
# Show the first 5 rows and first 5 columns of a data frame or matrix
hh <- function(d) d[1:5,1:5]
これは、 LaTeXへのテーブルのエクスポートに使用するための小さなスニペットです。これにより、私が作成する多くのレポートのすべての列名が数学モードに変更されます。私の.Rprofileの残りの部分はかなり標準的であり、ほとんどが上記で説明されています。
# Puts $dollar signs in front and behind all column names col_{sub} -> $col_{sub}$
amscols<-function(x){
colnames(x) <- paste("$", colnames(x), "$", sep = "")
x
}
以下を使用して、cacheSweave (または pgfSweave) を取得し、RStudio の [PDF をコンパイル] ボタンを操作します。
library(cacheSweave)
assignInNamespace("RweaveLatex", cacheSweave::cacheSweaveDriver, "utils")
言及されたアイデアのいくつかを含めて、これが私のものです。
あなたが見たいと思うかもしれない2つのこと:
.
.set.width <- function() {
cols <- as.integer(Sys.getenv("COLUMNS"))
if (is.na(cols) || cols > 10000 || cols < 10)
options(width=100)
options(width=cols)
}
.First <- function() {
options(digits.secs=3) # show sub-second time stamps
options(max.print=1000) # do not print more than 1000 lines
options("report" = c(CRAN="http://cran.at.r-project.org"))
options(prompt="R> ", digits=4, show.signif.stars=FALSE)
}
# aliases
w <- .set.width
.Last <- function() {
if (!any(commandArgs()=='--no-readline') && interactive()){
timestamp(,prefix=paste("##------ [",getwd(),"] ",sep=""))
try(savehistory("~/.Rhistory"))
}
}
R での CRAN ミラー選択のために tcltk ポップアップoptions(menu.graphics=FALSE)
を無効化/抑制したいので、私のものは含まれています。
これが私のものです。あまりにも革新的なものはありません。なぜ特定の選択をしたのかについての考え:
stringsAsFactors
CSVを読み込むたびに引数として渡すのは非常に面倒なので、デフォルトを設定しました。 .Rprofile がありませんでした。とはいえ、毎日セットしていないことによるトラブルに比べれば、トラブルは薄いので、そのままにしておきます。utils
の前にパッケージをロードしないと、ブロックoptions(error=recover)
内に配置されたときに回復を見つけることができません。interactive()
.db
ではなく、ドロップボックスの設定に使用しました。先頭は .で表示されないようにします。options(dropbox=...)
file.path
.
ls()
難しい話は抜きにして:
if(interactive()) {
options(stringsAsFactors=FALSE)
options(max.print=50)
options(repos="http://cran.mirrors.hoobly.com")
}
.db <- "~/Dropbox"
# `=` <- function(...) stop("Assignment by = disabled, use <- instead")
options(BingMapsKey="blahblahblah") # Used by taRifx.geo::geocode()
.First <- function() {
if(interactive()) {
require(functional)
require(taRifx)
require(taRifx.geo)
require(ggplot2)
require(foreign)
require(R.utils)
require(stringr)
require(reshape2)
require(devtools)
require(codetools)
require(testthat)
require(utils)
options(error=recover)
}
}
パッケージのトップ ディレクトリを指す環境変数 R_USER_WORKSPACE があります。.Rprofile で、(data() が機能するように) 作業ディレクトリを設定し、R サブディレクトリ内のすべての .R ファイルをソースする関数 devlib を定義します。上記の Hadley の l() 関数と非常によく似ています。
devlib <- function(pkg) {
setwd(file.path(Sys.getenv("R_USER_WORKSPACE", "."), deparse(substitute(pkg)), "dev"))
sapply(list.files("R", pattern=".r$", ignore.case=TRUE, full.names=TRUE), source)
invisible(NULL)
}
.First <- function() {
setwd(Sys.getenv("R_USER_WORKSPACE", "."))
options("repos" = c(CRAN = "http://mirrors.softliste.de/cran/", CRANextra="http://www.stats.ox.ac.uk/pub/RWin"))
}
.Last <- function() update.packages(ask="graphics")
プロフィールで格子色のテーマを設定しました。私が使用する他の2つの微調整は次のとおりです。
# Display working directory in the titlebar
# Note: This causes demo(graphics) to fail
utils::setWindowTitle(base::getwd())
utils::assignInNamespace("setwd",function(dir) {.Internal(setwd(dir));setWindowTitle(base::getwd())},"base")
# Don't print more than 1000 lines
options(max.print=2000)