Hadoop から作業するときに MIT jwi wordnet インターフェイスを使用しようとしています。このインターフェイスは、RAMDictionary オブジェクトを使用します。このオブジェクトのコンストラクターは、wordnet フォルダーの場所を示すファイルを受け取る必要があります。このフォルダーを hdfs にコピーしましたが、そこからファイル オブジェクトを作成することはできず、パスのみを作成できます。
これを回避する方法を知っている人はいますか?
それはあなたがしようとしていることに依存します。
あなたはHadoopで作業していると言っています。WordNet 辞書ファイル自体の処理に Hadoop を使用しようとしていますか? その場合、RAMDictionary は必要なく、パーサーだけが必要になる場合があります。例えば:
// for each line in each WordNet data file
ISynset synset = DataLineParser.getInstance().parseLine(line);
// do stuff with each synset
ただし、何か他のものを処理していて、それを行うためのツールとして WordNet 辞書を使用したい場合は、はい、これは少し複雑です。あなたは出来る: