ビジョンに基づく Web ページのセグメンテーションであるVIPSアルゴリズムを実装する必要があります。そのため、html ページをレンダリングするためのツールが必要です。ここに私の要件があります:
HTMLページの任意の文字の色を知りたいです。
html内の任意のタグについて、ブラウザで表示できるコンテンツがあれば、そのコンテンツの位置、つまりブラウザ上での開始座標と終了座標を知りたいです。
すべてのページがクローラーを介してダウンロードされているためです。Webkit は、ローカル ファイルとして保存されているページを処理できますか?
私のプロジェクトはJavaで開発されています。Webkit のどのポートが適していますか?
http://weblogs.java.net/blog/ixmal/archive/2008/05/introducing_jwe.html このリンクでは、次のように説明されています。ドキュメントの解析、DOM の生成、JavaScript のサポートを担当します. プラットフォームに依存する、いわゆる「ポート」と呼ばれる別の部分は、ネットワークとの通信、画面や他のデバイスでのグラフィック コンテンツのレンダリング、イベント処理、およびその他の機能を目的としています.すべてのクロスプラットフォーム呼び出しが Java で実装されている Java ポートです。」これに基づくと、2 番目の部分は役に立たないようです。1 番目の部分ですべての要件を満たすことができます。最初の部分だけを使用できますか?
誰でも私を助けることができますか?Webkit の使用方法に関するドキュメントが見つからないため、可能であればサンプル コードをいくつか教えてください。ありがとうございました!
下手な英語でごめんなさい!</p>