0

問題は本当に具体的です。

HTML コンテンツを取り、Linux lynx プログラムによって生成されるのと同じ形式でテキストを生成できる Java のライブラリが必要です。


サードパーティ サーバーから提供されたデータを Android のエンド ユーザーに公開する必要があります。データ形式は古く、フォーマットが不適切な HTML であるため、Java を使用して読み取ろうとしたところ、時々失敗します (受け入れられません)。また、毎月成長しており (プリインストールは除外されています)、「最新の」ものに変更するように説得することはできません (XML などでの生活は素晴​​らしいでしょう)。

最短ルート: W3 html2txt サービスをオンラインで使用するためのクラスを作成しました (Google 検索)。苦情があり、W3 サービスが時々失敗することに気付くまで、アプリで問題なく動作していました。それほど大したことではありませんが、ブラック ボックス ロジックでは、出力がこの "lynx のような" テキスト形式であることが想定されています。

そこで、アプリ内で "lynx スタイル" で変換 (HTML->TXT) を行うライブラリを作成し、W3 サービスの停止を回避したいと考えています。その上、lynx はおそらく私が見た中で最高の、最も組織的できちんとしたものを出力しました。

皆さん、何かご存知ですか?

4

2 に答える 2

0

lynxスタイルの意味がわからないので、これを送信すると完全にオフになる可能性があります(もしそうなら失礼します)。

しばらく前にコードの一部を使用してHTML/XMLファイルをチェックしました(当時はログでそれをプリッティングしていました

InputStream in = context.getResources()。openRawResource(id); StringBuffer inLine = new StringBuffer(); InputStreamReader isr = new InputStreamReader(in); BufferedReader inRd = new BufferedReader(isr);

文字列テキスト; while((text = inRd.readLine())!= null){inLine.append(text); inLine.append( "\ n"); } in.close(); inLine.toString();を返します。

お役に立てば幸いですが、もっと複雑なものが必要だと感じました:P

于 2010-11-12T02:31:06.117 に答える
0

1年経ったら諦めます。答えは次のとおりです。それを処理する方法はありません。Java にはライブラリがありません。少なくとも今のところ。

これを閉じます。ご清聴ありがとうございました。

于 2011-10-28T20:28:03.223 に答える