1

ユーザーがhtmlページ(Webから収集し、サーバー側にオフラインで保存したもの)を表示し、ユーザーがこのhtml内のテキストを操作する必要がある翻訳のようなWebアプリケーションを構築するつもりです。文字の一部のサブセット (翻訳のような操作を要求する)..

ここでのプロセスは 3 つの部分に分かれています:
- HTML ファイルからプレーン テキストを抽出します
- プレーン テキストはサーバーで前処理され、オフラインで保存されます
- ユーザーが HTML でオンラインで文字列を選択すると、識別する必要がありますすでに抽出してオフラインで保存したプレーンテキストのマッピング。

プレーンテキスト抽出には jsoup を使用します。
そして、私はすでにプレーンファイルを前処理していました..
マッピング部分と、ユーザーが選択した(またはクリックした)テキストの識別に関するアイデアはありますか?

[Java、Apache-Tomcat、JavaScript、Linux に対応]

4

0 に答える 0