MS Word ドキュメント ヘッダー (.doc) を読むと、次の例外が発生しました。
"A property claimed to start before zero, at -512! Resetting it to zero, and hoping for the best"
私はこのライブラリpoi-scratchpad-3.2-final-20081019
を使用し、このコードを読み取りに使用します:
import java.io.*;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.WordExtractor;
public class ReadDocFile {
public static void main(String[] args) {
File file = null;
WordExtractor extractor = null ;
try {
file = new File("c:\\New.doc");
FileInputStream fis=new FileInputStream(file.getAbsolutePath());
HWPFDocument document=new HWPFDocument(fis);
extractor = new WordExtractor(document);
String [] fileData = extractor.getParagraphText();
for(int i=0;i<fileData.length;i++){
if(fileData[i] != null)
System.out.println(fileData[i]);
}
}
catch(Exception exep){}
}
}