JS、CSSを含む任意のHTMLページを最小限の統一形式に変換できるライブラリはありますか?
たとえば、stackoverflowホームページをレンダリングする場合、最小限の形式で表示したいと思います。他のすべてのサイトをレンダリングしてほしい。
Lynx Webブラウザーのようなものですが、グラフィックは最小限です。
私が出会った HTML から Lynx スタイルのテキストへの最適なツールは、Jericho の Rendererです。
使い方は簡単です:
Source source=new Source(new URL(sourceUrlString)); // or new Source("<html>pass in raw html string</html>");
String renderedText=source.getRenderer().toString();
System.out.println("\nSimple rendering of the HTML document:\n");
System.out.println(renderedText);
(ここから)
また、HTML を実際の (不適切にフォーマットされた) 非常にうまく処理します。
Jericho を使用してこのようにフォーマットされたこのページの最初の数行を次に示します。
Stack Exchange ログイン | キャリア | チャット | メタ | について | よくある質問
スタック オーバーフロー * 質問 * タグ * ユーザー * バッジ * 未回答 * 質問する
Java HTMLノーマライザー?
**
任意の HTML ページを JS や CSS で全体をミニマルな統一フォーマットに変換できるライブラリはありますか?
たとえば、stackoverflow のホームページをレンダリングする場合は、最小限の形式で表示したいと考えています。他のすべてのサイトをダウンさせたい。
Lynx Web ブラウザーに似ていますが、グラフィックは最小限です。
java lynx link|edit|flag 質問 2 日前 Kim Jong Woo 593112 89% 受け入れ率 HTML コードをより単純な HTML コードに変換したいですか、それともこの「最小限の統一フォーマット」をユーザーに見せたいですか? それともイメージを作りたいですか?– Paŭlo Ebermann は昨日、要素の相対的な配置を犠牲にすることなく、より単純な html コードを作成しました。– キム・ジョンウ 16時間前
2 回答
最初の質問に答えるには:いいえ。その目的のためのライブラリはないと思います。(少なくともこれが私の「グーグル」の結果です)。
その理由は、あなたが望んでいるのは非常に特別なニーズだからだと思います。
したがって、問題の解決策として、htmlを解析して、JEditorpaneまたは表示に使用しているもので希望する方法で表示できます。
私はそれを行う方法しか提案できません(これは、私がxmlとその周りのすべてに精通しているためです)。
* Use a library to ensure that your html conforms to xhtml:
http://htmlcleaner.sourceforge.net/release.php
* then either parse the xml with DOM or SAX parsers and display it the
あなたが望む方法。
また
* use xslt to transform the document into some other html document
これにより、ニーズに合ったビューが得られます。
また
* use one of the available html parser librarys. (The most of which i
時代遅れの場所が見つかりました(2006))が、オプションになる可能性があります。
これは、それを行う方法の 1 つの提案にすぎません。同じことを行う方法は他にも何千もあります。
最初の質問に答えるには:いいえ。その目的のためのライブラリはないと思います。(少なくともこれが私の「グーグル」の結果です)。
その理由は、あなたが望んでいるのは非常に特別なニーズだからだと思います.
したがって、問題の解決策として、htmlを解析して、JEditorpaneまたは表示に使用しているもので希望する方法で表示できます。
私はそれを行う方法を提案することしかできません(これは、私がxmlとその周りのすべてに精通しているためです).
ライブラリを使用して、html が xhtml に準拠していることを確認してください: http://htmlcleaner.sourceforge.net/release.php
次に、DOM または SAX パーサーを使用して xml を解析し、必要な方法で表示します。
また
また
これは、それを行う方法の 1 つの提案にすぎません。同じことを行う方法は他にも何千もあります。