0
  1. Amazon s3 から PDF ファイルを読み取る (boto を使用)
  2. 123.pdf としてローカルに保存します
  3. PDFLib/TET を使用して、ローカルに保存された pdf を開いて解析します

現在、上記の 3 つの手順をすべて実行できますが、ディスク I/O を節約するために手順 2 をスキップしたいと考えています。

tet_open_document_mem を使用して TET にメモリ内のドキュメントを開くことができるように見えますが、使用方法に関するドキュメントはありません。

4

1 に答える 1

1

TET は、いわゆる PDFlib 仮想ファイルシステム (PVF) を提供して、このような状況を処理します。

create_pvf() を使用して、メモリに提供されたデータから名前付きの仮想読み取り専用ファイルを作成できます。

API は次のようになります (C):

void TET_create_pvf(TET *tet, const char *filename, int len, const void *data, size_t size, const char *optlist)

したがって、次のように使用できます。

TET_create_pvf(tet, pvfname, 0, data, length, "");
doc = TET_open_document(tet, pvfname, 0, docoptlist);

詳細は TET マニュアルhttp://www.pdflib.com/fileadmin/pdflib/pdf/manuals/TET-4.3-manual.pdfにあります。

TET_open_document_mem は、もはやサポートされていない古い API です。

于 2014-06-20T09:04:38.130 に答える