css を含む html があり、html ドキュメント内の指定されたテキストの実際の色 (およびその他のビジュアル テキスト属性) を確認したいと考えています。JSoup でこれを行うことはできますか、それとも本物そっくりの HTML エンジン/プロセッサを探す必要がありますか? この操作の処理速度は、主な要因の 1 つです。
5 に答える
彼はこのデータを Java プログラムで取得したいと考えています。したがって、いくつかのことを行う必要があります。
- スタイルシート ファイルをダウンロードします。
- html を解析してクラス属性を見つけます。
- css の .class を html 属性と一致させ、必要な特定の情報を見つけます。
ただし、 class属性のない html 要素に関する情報を検索する場合は注意してください。このような場合、html 要素の xpath を見つける必要があります。
<table class="entityTable">
<tr>
<td> <input type="text" value="abcdef" /></td>
</tr>
次に、 body/div/.../table/tr/td/inputのような xpath を見つける必要があり、入力タグ属性に影響を与える可能性のある CSS ルールに一致させる必要があります。
.entityTable tr td input
{
color:red;
}
これははるかに難しいため、解析する html がページのどこにでもクラス属性を html タグに配置する場合。それ以外の場合は、html タグを css ルールに一致させる方法を見つける必要があります。
乾杯。
まだベータ版ですが、Cobra HTML パーサーにはこの機能があります。
標準のHTMLテーブルのデフォルトの境界線や標準のリンクの色など、Webページ内のオブジェクトに関する正確な情報を知る必要がある場合は
、FireFoxのFireBug拡張機能を使用してください。
CSSBox は間違いなくあなたが望むものです。外部 CSS を読み込んで、DOM 要素ごとにインライン スタイルに変換できます。
アプレットでこれを行っている場合は、javascript を使用して情報を収集し、それをアプレットに渡すことができます。