0

ケース:

  • サーバーは exec/shell_exec をサポートしていません (したがって pdftotext は除外されます)
  • 他のライブラリは PDF を受け入れません。Pdftotext は動作します (ファイルでローカルにテスト済み)

(PDF)コードからの抜粋を次に示します。


5 0 obj
>
stream
Gat$ugPXc?%"6H'p]ofd'_qs00UX27?3p0*8m>KOQL4]:u"*$$^'f*q*SGMee*e$5&=alj\@GV7YPq9pg!Lr0>Y2n'&lmd4Br?V9N
P:_",WI.kJ\#'cs>77M9eTkA;,t#f)aaGuNS-6=Wp*uBg,Ft9Tcj#aI]nD[C6&m@9m?m!p6=IBt=o_LGHh!q>f$C.jdOXbSP/796HV`_Y]Y
l)M(]FZ9Ld-J_mMRe2q(D>`V@G`NM]crn@_V?sGC@W9^bnrY$.mqeVN^YEcqK)blO~>
endstream
endobj

クリエイターについて:

%PDF-1.4
1 0 オブジェクト
>
endobj

exec/shell_exec 関数を使用せずに、これを PHP でプレーン テキストに変換する方法について、いくつかの提案を得たいと思います。

ありがとうございました。

( http://webcheatsheet.com/php/reading_clean_text_from_pdf.phpのような他のソリューションは機能せず、少なくともこのコードを ASCII コードのようなものに変換することはできませんでした。)

4

1 に答える 1

2

ファイル内の他の多くのデータ(フォントエンコーディングなど)を使用してデータをデコードする必要があるため、このストリームを解析することはできません。あなたは本当にこれを行うためにライブラリを使用したいです...

于 2012-06-15T06:51:51.147 に答える