java - HTML の解析とマッピング

翻译自：https://stackoverflow.com/questions/10172428 2012-04-16T10:28:45.693

90 次

ユーザーがhtmlページ（Webから収集し、サーバー側にオフラインで保存したもの）を表示し、ユーザーがこのhtml内のテキストを操作する必要がある翻訳のようなWebアプリケーションを構築するつもりです。文字の一部のサブセット (翻訳のような操作を要求する)..

ここでのプロセスは 3 つの部分に分かれています:
- HTML ファイルからプレーンテキストを抽出します
- プレーンテキストはサーバーで前処理され、オフラインで保存されます
- ユーザーが HTML でオンラインで文字列を選択すると、識別する必要がありますすでに抽出してオフラインで保存したプレーンテキストのマッピング。

プレーンテキスト抽出には jsoup を使用します。
そして、私はすでにプレーンファイルを前処理していました..
マッピング部分と、ユーザーが選択した（またはクリックした）テキストの識別に関するアイデアはありますか?

[Java、Apache-Tomcat、JavaScript、Linux に対応]

java - HTML の解析とマッピング

0 に答える 0

Related

Reference