PDFファイルからテキストを抽出する必要があり、PDFファイルからすべてのテキストストリームを取得して解凍するこの記事を見つけました..しかし、テキストをUnicodeで抽出する必要があるため、wchar_t文字を使用できるようにコードを適応させようとしました. 唯一の問題は、zlib が解凍のために一度に 1 バイトしか受け付けないことです。そして、私の wchar_t には 1 文字あたり 1 バイトがありません。
それで、私がここで物事を解決できる方法はありますか?:)
PDFファイルからテキストを抽出する必要があり、PDFファイルからすべてのテキストストリームを取得して解凍するこの記事を見つけました..しかし、テキストをUnicodeで抽出する必要があるため、wchar_t文字を使用できるようにコードを適応させようとしました. 唯一の問題は、zlib が解凍のために一度に 1 バイトしか受け付けないことです。そして、私の wchar_t には 1 文字あたり 1 バイトがありません。
それで、私がここで物事を解決できる方法はありますか?:)