このフォーラムで質問するのは初めてなので、皆さんが厳しすぎないことを願っています。今学期、私は Project を行っていましたが、Web サイト (1 つではなく、多数) から記事を解析し、テキスト ファイルまたは SQLite Database に保存できる Android アプリケーションを作成することにしました。私はこれをすでに5か月間行っていますが、追加などの特定の記事とは関係なく、Webページから特定のプレーンテキストを取得する方法が本当にわかりません。このフォーラムを通じて、データを解析する方法を見つけましたJsoupを使用して1つのWebサイトから(私は自分のプロジェクトで使用しています)。また、複数の Web サイトでも機能する可能性があると考えていましたが、多くの Web サイトでは特定の記事のコンテンツを表すために異なる html タグを使用しているため、'. 確かではありませんが、このフォーラムで誰かがこの種のことは不可能だと言ったのを見たと思いますが、Pocket (以前の Read it Later) や Instapaperなどのような種類のアプリの存在をどのように説明できますか? これらのアプリは最終的にアプリに実行してもらいたいことを実行します。それで、私がそれについて何ができるかについて、誰かが何か提案をすることができますか? ありがとう。
質問する
322 次
1 に答える
0
ストーリー全体を表示するかどうかはわかりませんが、コードは次のとおりです。
doc = Jsoup.connect("http://"+URLField.getText().toString()+"").get();
// get page title
title = doc.title();
doc = new Cleaner(Whitelist.none()).clean(doc);
ここでは、単純に Jsoup ライブラリとその Cleaner クラスを使用していますが、表示したくないテキストが大量に表示されます。明確にするために画像を投稿したかったのですが(何が欲しいか)、このフォーラムではそれができません。
于 2013-05-23T05:52:43.373 に答える