テキストを解析するために、WordファイルをRに読み込もうとしています。しばらく調査した後、Apache POI が最適な方法であることがわかりました。これは、さまざまな Word 形式を処理する上で最も柔軟であるように思われるからです。
R パッケージのxlsx' or
commonJavaJars and
xlsxjars` が何をするかを追ってみました。残念ながら、同様に機能する R の行をいくつか作成することはできませんでした。例えば:
inputStream <- .jnew("java/io/FileInputStream", path.expand(file))
wbFactory <- .jnew("org/apache/poi/ss/usermodel/WorkbookFactory")
これから得られることは、最初に入力ストリームが作成されることです (これは、単語 fie に対しても実行できました)。次に、このワークブック ファクトリは、apache poi library
別の .jnew を使用して作成されます。Word の同様の機能を探して、POI パッケージのこの部分を見つけて試しました。
wdoc <- .jnew("org/apache/poi/hwpf/HWPFDocument")
私が得たのはjava.lang.ClassNotFoundException
. 依存する.jars を含むpoi-3.9-20121203.jar
ソース コードに があるため、Excel 関連パッケージ以外の POI パッケージを利用できるはずです 。xlsxjars
xlsx
また、パッケージを使用commonJavaJars
して機能を実行しようとしました
loadJars("ポイ")
エラーは発生しませんでしたが、後続の呼び出しでは成功しませんでした。誰かが私をここから始めさせてもらえますか?
編集:ここで明らかにパッケージが恋しいです。jars
R セッションにすぐに追加をロードできますか、それともパッケージをコンパイルして新しい jar を追加する必要がありますか?