2

関連するいくつかの質問を調べましたが、探している答えが含まれていませんでした。だから、ここに私の質問があります:

私の職場にはいくつかの Web アプリケーションがあり、それらは異なるフレームワークを使用して作成されており、作成者は長い間機能の更新を求めていません。したがって、私は毎日、数キロバイトのファイルサイズに相当する、取得するために同じ一連の厳しいアクションを実行する必要があります.

ページのソースを解析してみましたが、作者のプログラミング技術が随所に散りばめられていました。データがテキストとして表示されないように意図的にコードを隠す人もいますが、彼らが書いたコードは会社の資産であるため、その理由はありません。簡単に言えば、これらのページのテキスト コンテンツをコピーして貼り付けることができれば、ページ ソースを解析してテキストを取得するよりもはるかに簡単にそのデータを処理できることに気付きました (完全に不可能な場合もあります)。

そのため、私は現在、これらのページをロードし、起動時に画面上のテキストをファイルに保存するブラウザー プラグイン (Windows または Linux 環境) または Windows または Linux 上の同等のテキスト ベースのツールを探しています。

どんなに頑張っても、手ぶらでやってきます。

データは会社の機密であり、外部の者がアクセスできないため、サードパーティのスクリーン スクレイピング Web サイトのサービスを利用したくありません。これらのアプリが実行されているサーバーにアクセスできないため、すべてクライアント エンドで実行する必要があります (ほとんどの場合、Windows フロント エンドの IIS とバック エンドの Oracle db です。前に説明したように、中間層は誰のワイルドでもあります。ネイティブのオラクル アプリから weblogic、Tomcat、社内で開発された Java/JavaScript のものまでさまざまです。

事前にご協力いただきありがとうございます

4

3 に答える 3

0

リンク、lynx、または w3m のいずれかが必要なことを行います。これらはテキスト ブラウザであり、たとえば次のように Web ページからテキストをダンプできます。

w3m -dump http://www.google.com > g.txt
于 2012-11-15T23:56:50.587 に答える
0

次のようなものはどうでしょうか: http://www.nirsoft.net/utils/htmlastext.html HTML ページをテキストに変換するフリーウェア

于 2012-11-14T18:41:48.790 に答える