1

PHP を使用して Word (2007-2013) ファイルを読み取る方法に関する推奨事項はありますか? ビルドイン スタイルを使用して Word 文書をマークアップしています。内容を分析するために、理想的には PHP でそれを読みたいと考えています。Google とこのサイトを検索してみましたが、うまくいきません。誰かがこれに関する経験や、私がどこから始めるべきかについてのアイデアを持っているなら、それは大歓迎です.

4

5 に答える 5

4

Word 文書の内容だけに興味があり、たとえばそれを HTML ページに変換する場合。内部構造が非常に複雑なため、PHPWord はお勧めしません。次のコードは、PHP ネイティブ機能のみを使用して、docx ドキュメントのすべての段落を読み取ります。

 /*DOCX is actually a ZIP file containing other files, document.xml 
holds the text of you document, sadly not the styles, you need to drill
further into other files to extract the styles*/

    $result = file_get_contents('zip://word.docx#word/document.xml');

    //Load the document XML into PHP's SimpleXML
    $xml = simplexml_load_string($result,null, 0, 'w', true);
    $body = $xml->body;
    foreach($body[0] as $key => $value){
        echo "<p>";
        if($key == "p"){
            foreach ($value->r as $kkey => $vvalue) {
                echo (string)$vvalue->t;
            }
        }
        echo "</p>";
    }
于 2015-08-17T12:05:15.410 に答える
0

あなたが探していたものではないことは承知していますが、Word 文書を .odt で再保存してもらえませんか?

この記事は、その段階に到達した場合に役立つ可能性があります: PHP での odt ファイルの読み取り

于 2013-02-08T03:47:43.653 に答える
0

PHPワードが使える!ドキュメントを読む機能があると思います。

于 2013-02-08T02:16:29.453 に答える