正確に何が起こるかはわかりませんが、私の調査結果をお伝えします。ドライブ内のファイルの PDF ビューの HTML コードを調べると、次のようなものが見つかります。
<div id="page-pane" class="">
<div id=":2h.page.0" class="page-element goog-inline-block" style="width: 820px;">
<div>
<div class="highlight-pane"></div>
<div class="highlight-pane">
<div class="highlight selection-highlight" style="left: 154px; top: 142px; width: 268px; height: 13px;"></div>
<div class="highlight selection-highlight" style="left: 105px; top: 164px; width: 73px; height: 14px;"></div>
<div class="highlight selection-highlight" style="left: 154px; top: 181px; width: 128px; height: 13px;"></div>
</div>
<div class="highlight-pane"></div>
<div class="highlight-pane"></div>
<img class="page-image" style="width: 800px; height: 1131px; display: none;" src="https://docs.google.com/file/d/0BzxfQAgMGNM6VGg4RFlBZkdoOWM/image?pagenumber=1&w=138" /><img class="page-image" style="width: 800px;" src="https://docs.google.com/file/d/0BzxfQAgMGNM6VGg4RFlBZkdoOWM/image?pagenumber=1&w=800" />
<p id=":2h.a11y.0" class="accessibility-text" tabindex="-1"></p>
</div>
</div>
4 つのhighlight-pane
div とその中に 1 つの divがありimg
ます2h.page.0
(pdf のページ 0)。div は、img
あなたが話している画像を示しています。これは単なる単純な画像で、OCR はありません。あなたが言及した選択されたテキストはhighlight-pane
、画像上でボックスをドラッグすると動的にdivが追加された2番目のものです。秒内の 3 つの divhighlight-pane
は、選択されたテキストを表します (これは、選択されたテキストの 3 行に対応します)。
ページにアクセスすると、次のことが起こります。
- ドライブに保存されている PDF からページの画像を表示します。
- ページで何かを選択します。ドラッグボックスを作成します。
- 選択すると、pdf で OCR を実行する JavaScript がトリガーされます (OCR 出力は既に計算されている可能性があります)。
- OCRの出力は、div内の
highlight-pane
divに追加されます