4

JS、CSSを含む任意のHTMLページを最小限の統一形式に変換できるライブラリはありますか?

たとえば、stackoverflowホームページをレンダリングする場合、最小限の形式で表示したいと思います。他のすべてのサイトをレンダリングしてほしい。

Lynx Webブラウザーのようなものですが、グラフィックは最小限です。

4

2 に答える 2

2

私が出会った HTML から Lynx スタイルのテキストへの最適なツールは、Jericho の Rendererです。

使い方は簡単です:

    Source source=new Source(new URL(sourceUrlString)); // or new Source("<html>pass in raw html string</html>");
    String renderedText=source.getRenderer().toString();
    System.out.println("\nSimple rendering of the HTML document:\n");
    System.out.println(renderedText);

ここから)

また、HTML を実際の (不適切にフォーマットされた) 非常にうまく処理します。

Jericho を使用してこのようにフォーマットされたこのページの最初の数行を次に示します。

Stack Exchange ログイン | キャリア | チャット | メタ | について | よくある質問

スタック オーバーフロー * 質問 * タグ * ユーザー * バッジ * 未回答 * 質問する

Java HTMLノーマライザー?

**

任意の HTML ページを JS や CSS で全体をミニマルな統一フォーマットに変換できるライブラリはありますか?

たとえば、stackoverflow のホームページをレンダリングする場合は、最小限の形式で表示したいと考えています。他のすべてのサイトをダウンさせたい。

Lynx Web ブラウザーに似ていますが、グラフィックは最小限です。

java lynx link|edit|flag 質問 2 日前 Kim Jong Woo 593112 89% 受け入れ率 HTML コードをより単純な HTML コードに変換したいですか、それともこの「最小限の統一フォーマット」をユーザーに見せたいですか? それともイメージを作りたいですか?– Paŭlo Ebermann は昨日、要素の相対的な配置を犠牲にすることなく、より単純な html コードを作成しました。– キム・ジョンウ 16時間前

2 回答

最初の質問に答えるには:いいえ。その目的のためのライブラリはないと思います。(少なくともこれが私の「グーグル」の結果です)。

その理由は、あなたが望んでいるのは非常に特別なニーズだからだと思います。

したがって、問題の解決策として、htmlを解析して、JEditorpaneまたは表示に使用しているもので希望する方法で表示できます。

私はそれを行う方法しか提案できません(これは、私がxmlとその周りのすべてに精通しているためです)。

* 

  Use a library to ensure that your html conforms to xhtml:

http://htmlcleaner.sourceforge.net/release.php

* 

  then either parse the xml with DOM or SAX parsers and display it the

あなたが望む方法。

また

* use xslt to transform the document into some other html document

これにより、ニーズに合ったビューが得られます。

また

* use one of the available html parser librarys. (The most of which i

時代遅れの場所が見つかりました(2006))が、オプションになる可能性があります。

これは、それを行う方法の 1 つの提案にすぎません。同じことを行う方法は他にも何千もあります。

于 2011-03-02T10:49:41.747 に答える
1

最初の質問に答えるには:いいえ。その目的のためのライブラリはないと思います。(少なくともこれが私の「グーグル」の結果です)。

その理由は、あなたが望んでいるのは非常に特別なニーズだからだと思います.

したがって、問題の解決策として、htmlを解析して、JEditorpaneまたは表示に使用しているもので希望する方法で表示できます。

私はそれを行う方法を提案することしかできません(これは、私がxmlとその周りのすべてに精通しているためです).

  • ライブラリを使用して、html が xhtml に準拠していることを確認してください: http://htmlcleaner.sourceforge.net/release.php

  • 次に、DOM または SAX パーサーを使用して xml を解析し、必要な方法で表示します。

また

  • xslt を使用してドキュメントを他の HTML ドキュメントに変換すると、ニーズに合ったビューが得られます。

また

  • 利用可能な html パーサー ライブラリのいずれかを使用します。(そのほとんどは時代遅れ (2006 年) の場所で見つかりました) しかし、それらはあなたの選択肢になる可能性があります。

これは、それを行う方法の 1 つの提案にすぎません。同じことを行う方法は他にも何千もあります。

于 2011-03-02T08:51:14.580 に答える