2

私は、ユーザーが日本語の HTML ページからテキストまたはコンテンツをアップロードし、カーソルを使用してテキスト/コンテンツ内の単語を選択して英語に翻訳できるようにするプロジェクトに取り組んでいます。ただし、この機能を PDF ファイルに拡張できるようにしたいと考えています。基本的に、ユーザーが PDF ファイルを送信し、ブラウザーがその PDF ファイルをレンダリングして、ユーザーが PDF 内の単語を選択/強調表示したときに、ブラウザーが何らかの形でそのテキストを中継できるようにしたいと考えています。強調表示されたセクションは、javascript などを介して、PHP 変数に中継されます。

同様の質問をするstackoverflowに関する投稿がたくさんあることは知っていますが(私はそれらすべてを整理するのに何時間も費やしました!)、これが可能かどうかについて決定的な答えを見つけることができないようです. PDF を HTML に変換したり、PDF からテキストを抽出したりするためのオプションはたくさんあるようですが、正直なところ、これらのオプションのいずれかが私が達成しようとしていることに関連しているかどうか、私は混乱しています。また、Adobe 用の JavaScript API があることは知っていますが、JavaScript を既に PDF に埋め込む必要があるという印象を受けています。これは、ユーザーが独自の PDF ファイルをアップロードしてレンダリングする場合には当てはまりません。それが可能だとしても、Adobe JavaScript API にはネイティブのテキスト選択サポートがないようです....

これを行うための簡単な回避策(オキシモロン?)はありますか?繰り返しますが、PDF で選択したテキストを変数に渡すことができるようにしたいと考えています。その効果は、ユーザーが知らない単語を強調表示して、それらの単語を単語バンクに追加して辞書で検索できるようにすることです。

何か明確にできることがあれば教えてください。ありがとうございました!

4

1 に答える 1

0

あなたの最善の策は、PDFをHTMLに変換することだと思います(この回答を参照してください)。その後、通常のHTMLのすべてをすでに実装しているため、すでに設定されています。

于 2012-04-24T06:43:47.473 に答える