問題タブ [cgpdfscanner]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
iphone - iOS: PDF スキャナーがテキストの座標を取得する
PDFをスキャンするためにCGPDFScannerを使用しています。テキストの位置を見つけるために Td 演算子を使用する必要がありますか? この演算子を使用してテキストの位置を取得する方法の例を教えてください。現在、テキストを検索するために Tj および TJ 演算子を使用しています。ここで、pdf の 1 ページ内の各単語の位置を知りたいと思います。どうやってやるの?
ありがとう
parsing - PDFを解析すると、異なるページで同じテキストが2回取得されます
2ページを含むPDFファイルがあります。Ojective-C のパーサーで解析すると、次のような状況になります。
最初のページはすべてOKです。必要なテキストがあります(Preview、Adobe ReaderなどのPDFリーダーで視覚的に確認できます...)。2 番目のページには、2 番目のページに表示されるテキストと、2 番目のページにはない最初のページのテキストの一部があります。
私は他のパーサーで試しました: pdftotext (xpdf) 彼らは正しい結果を得ることができました。Pdfminer (python) https://pypi.python.org/pypi/pdfminer/、私と同じ結果が得られました。最初のページのテキストの一部が 2 回抽出されます。
私の質問は次のとおりです。この状況を見たことがありますか?テキストが 2 ページ目に実際に存在する場合、pdf リーダーはそれを表示しないのはなぜですか? これについて何か考えはありますか?
ios - CGPDFDictionaryRef の「Tj/TJ」演算子から正確なテキストを読み取る
CGPDFDictionary の"Tj/TJ"演算子からテキストを読み取ろうとしていますが、TJ/Tj 演算子には、たとえば Tj = <00><1F><05>の (エンコードされた) 形式のテキストがあります。今、私は NSString でこの正確なテキストを取得したいです。つまり、NSString には "<00><1F><05>" が含まれている必要があります。CGPDFStringGetBytePtrを使用するchar*またはCGPDFStringCopyTextStringを使用するNSStringでは、目的の出力が得られません。解決策を教えてください。
ios - PDF のスキャン中にスペースが検出されない - iOS (CGPDFScanner)
PDFからテキストを抽出したいPDFスキャンに取り組んでいます。検索にpdf Multithreading.pdfを使用しています。テキストを抽出することはできますが、テキストからスペースを抽出することはできません。Tj オペレーターではなく、Tj オペレーターのコールバックのみを取得しています。何が問題になる可能性がありますか?
ありがとう
ios - CGPDFScannerScan がコールバック関数を呼び出さない
別のアプリからメニューで開く... を介してアプリに送信されstrings
たものを取得しようとしています。pdfFile
私はapdfscanner
を渡しpdfPage
、スキャナーはcallBackを起動する必要があります。"getString"
私は主にSWIFTを使用していますが、スキャナーコードはobjective-Cにあります。問題は、pdfDocを別のアプリから自分のアプリに送信すると、「getString」callBack発火しません。Macbook ProのディレクトリからURLを使用して同じドキュメントをアプリに送信すると、機能し、「getString」callBackが呼び出されます。デバッガーをチェックすると、常に有効な CGPDFPageRef を「extractStringsFromPDFPage:」メソッドに渡します。どちらの場合も、有効な CGPDFContentStream と CGPDFOperatorTable があります
スキャナーのコードは次のとおりです。
appDelegate からアプリにドキュメントを送信する方法は次のとおりです
私は一日中これを続けてきました。どんな助けでも大歓迎です。