PHPを使用してdocxファイルの画像のハイパーリンクを読み取る際に問題があります。また、同じ docx ファイルのヘッダーとフッターの内容を読み取ることができませんでした。PHPDOCX が DOCX ファイルで動作する近親者であることがわかりましたが、それでもこの答えは見つかりませんでした。あなたの助けに感謝します。前もって感謝します。
ナバラジ
docxについてはわかりませんが、docでは機能します。以下を試してください
function parseWord($userDoc)
{
$fileHandle = fopen($userDoc, "r");
$line = @fread($fileHandle, filesize($userDoc));
$lines = explode(chr(0x0D),$line);
$outtext = "";
foreach($lines as $thisline)
{
$pos = strpos($thisline, chr(0x00));
if (($pos !== FALSE)||(strlen($thisline)==0))
{
} else {
$outtext .= $thisline." ";
}
}
$outtext = preg_replace("/[^a-zA-Z0-9\s\,\.\-\n\r\t@\/\_\(\)]/","",$outtext);
return $outtext;
}
$text = parseWord("1.doc");
echo $text;
ハイパーリンクを識別し、簡単なロジックを使用できます。ヘッダーとフッターもプルされます