2

Javaを呼び出すR言語のtmパッケージのstemDocumentを使用してコーパスをステミングしようとしています。私はtmマニュアルの例を試しました:

data("crude")
crude[[1]]
stemDocument(crude[[1]])

次のエラーが発生します。

Could not initialize the GenericProperitiesCreator.  This exception was produced:  
java.lang.NullPointerException

助けていただければ幸いです。私はJavaについて何も知りません。

ありがとう

4

3 に答える 3

1

Snowballステムマー(snowball.jar)がweka.jarファイルを見つけることができません。

コンピューターで、weka.jarというファイルを検索する必要があります。私のLinuxシステムでは、次の場所にあります。

/usr/local/lib/R/site-library/RWekajars/java/weka.jar

次に、Rコードで、次のような行を上部に追加します。

wekajar="/usr/local/lib/R/site-library/RWekajars/java/weka.jar"
oldcp=Sys.getenv("CLASSPATH")
newcp=NULL
Sys.setenv(CLASSPATH=paste(wekajar,newcp, sep=":"))

library("tm")    
data("crude")
stemDocument(crude[[1]], language = "english" )

これにより、RセッションのJavaCLASSPATHが上からweka.jarファイルに設定されます。ただし、既存のクラスパスはリセットされます。が必要な場合は、古いエントリを追加し直すことができます。

于 2013-01-10T15:04:55.290 に答える
1

いい質問ですね。うまくいきましたか?

あなたが持っているコードだけで同じエラーが発生します。しかし、最初から例に従って (つまり、p. 1の「変換」という見出しで) コーパスを作成し、それをプレーン テキスト ドキュメントに変換すると、Java エラーを回避できます。マニュアルのコード例は、これら 2 つの手順を既に実行していることを前提としていると思います。

とはいえ、結果を調べると、実際のステミングはありません... @ user813966のstemDocumentの簡単な例でステミングを行うことさえできません。代わりに、RStem および SnowBall パッケージを見ています。

それまでの間、Python パッケージ NLTKは私のステミング ツールです。

更新:次のように追加することで、stemDocument関数が機能するようになりましたlanguage = "english":

a <- tm_map(a, stemDocument, language = "english") 

したがって、あなたの質問に対する完全な答えは、tm パッケージに従ってテキストを R に入力するすべての手順に従うことです。また、stemDocument を機能させるには、rJava が必要です (また、Windows で作業している場合は、JAVA_HOME の環境変数を jre ディレクトリを含むディレクトリに設定する必要があります)。

于 2011-11-12T07:24:46.553 に答える
1

私の側にも同じエラーがありました。クラスパスに Snowball .jar と対応するステムワードの /words リポジトリを追加することで解決しました: C:\Users\xxx.xxx\Documents\R\win-library\2.12\Snowball\java

これはここで推奨されました: http://weka.wikispaces.com/Stemmers

まだ次のエラーがありますが、現在は正常に動作しています。

Trying to add database driver (JDBC): RmiJdbc.RJDriver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): jdbc.idbDriver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): org.gjt.mm.mysql.Driver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): com.mckoi.JDBCDriver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): org.hsqldb.jdbcDriver - Warning, not in CLASSPATH?
[KnowledgeFlow] Loading properties and plugins...
[KnowledgeFlow] Initializing KF...
于 2011-11-25T19:04:47.447 に答える