2

.doc または .docx ファイルを入力として受け取り、それらの単語をデータベース テーブルに抽出するアプリケーションを開発しています。

この目的で Apache POI を試してみたところ、左から右へのテキスト形式 (英語など) のドキュメントでこれをうまく管理できました。

コードは次のとおりです。

// FilterDOC Method Which Tacke A Document As Input and Return A Generic 
// List Withs Its Words

public static void parseDoc(File SelectedFile, FileReader in) {
try {
         // Create a POI File System object 
        POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream(
                SelectedFile));

     // Create a document for this file 
    HWPFDocument doc = new HWPFDocument(fs);

     // Create a WordExtractor to read the text of the word document
            WordExtractor we = new WordExtractor(doc);

        String ExtractedText = we.getText();

     // Removing New Empty Lines
    String RemoveEmptyLines = ExtractedText.replaceAll("[\n\r]", "");

     // Filtering document of any symbols
    String[] Wordlist = RemoveEmptyLines
                .split("[:\\,\\.\\}\\?\\{\\[\\]\\‘\\_\\*\\&\\%\\#\\$\\@\\!\\~\\/\\//\\|\\?\\“\\:-\\;\\W\\s+]");

    List<String> lines = new ArrayList<String>();

        for (String line : Wordlist) {

            if (line != null && !line.trim().isEmpty()
                    && !line.equals("\\W\\s+")) {
                lines.add(line.trim());

            }

        }

       // output the document
    for (String string : lines) {

            System.out.println(string);}
                  in.close();



    } 

          catch (IOException e){ 
            System.out.println("IO Exception !!"+ e.getMessage());      }
}

右から左へのテキスト形式 (アラビア語など) のドキュメントで同じライブラリを使用するにはどうすればよいですか?

4

1 に答える 1

0

権利から賃貸へのセットの場合:

sheet.setRightToLeft()
于 2013-03-24T22:02:47.153 に答える