問題タブ [html-tableextract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1249 参照

css-selectors - 「スレッド」に基づいて HTML テーブル コンテンツを抽出する

以下は基本的な HTML テーブルです。

ソース ファイルにそのようなテーブルがいくつかあるとします。のオプションhxextract、または CSS3 セレクターhxselect、または他のツールで使用できるものはありますtheadか? それとも、それほど単純ではないawk(または、送信前に見つかったperlの可能性がある) スクリプトで立ち往生していますか?

更新: コンテンツベースの抽出の場合、perlHTML::TableExtractはトリックを行います:

ただし、場合によっては、単純なlynx -dump mywebpage.html結合 wihawkなどでも同じくらい効率的です。

0 投票する
1 に答える
196 参照

perl - 複数のファイルの特定の文字列を含むすべての HTML テーブルを印刷する (perl)

ディレクトリ内の各 xml ファイルの文字列「kcat」を含むすべての HTML テーブルを印刷しようとしていますが、問題が発生しています。ディレクトリ内の各ファイル (kcat_tables という名前) には、kcat を含む HTML テーブルが少なくとも 1 つあることに注意してください。このプログラムを ubuntu 仮想マシンで実行しています。これが私のコードです:

これを修正する方法についてのアイデアはありますか? 前もって感謝します!また、私はPERL言語にかなり慣れていないので、シンプルでわかりやすい回答をいただければ幸いです。

0 投票する
1 に答える
15467 参照

html - HTML テーブルの解析/抽出、Java での Web サイト

この HTML テーブルの内容を解析したい:

引用符

ソースコード付きの完全なウェブサイトは次のとおりです。

http://www.kantschule-falkensee.de/uploads/dmiadgspahw/klassen/A_Klasse_11.htm

例として、「モンタグ」(月曜日)の下の5つのセルすべての各セルのデータを解析したいと思います。JSOUP を使用してこの Web サイトを解析する方法をいくつか試しましたが、うまくいきませんでした。私の主な目標は、Android アプリのリストビューにコンテンツを表示することです。今のところ、Java コンソールで内容を印刷しようとしました。両方の言語が受け入れられます:)。どんな助けでも大歓迎です。

0 投票する
1 に答える
356 参照

excel - VBA Web スクレイピング

このウェブサイトのこのテーブルからデータの行を取得しようとしています: http://www.nasdaq.com/symbol/neog/financials?query=balance-sheet

これで、次を使用して「総負債」行を取得できます

しかし、普通株などの他のデータ行を取得する方法がわかりません。

それが役立つ場合は、取得したい HTML ソースと強調表示された tr があります。

HTML コードのスクリーンショット

問題は、テーブルの行データを見つける方法です。他の行のデータを取得する方法を誰かに説明してもらえますか? よろしくお願いします!

0 投票する
1 に答える
42 参照

html - readHTMLTable はデータフレーム値を整数として返します

列名をその行の文字列に設定する代わりに、下のマークされた行が数値を返す理由を誰かが説明できますか? colClassesテーブルを読むときにコメントアウトされた行を含めると、正しい列名を取得するにはどうすればよいですか?

0 投票する
1 に答える
210 参照

html - perlでウェブサイトから特別な種類のテーブルを抽出するにはどうすればよいですか?

Perl モジュール HTML::TableExtract を使用して、Web サイトhttp://finance.yahoo.com/etf/lists/?bypass=true&mod_id=mediaquotesetf&tab=tab1&scol=imkt&stype=desc&rcnt=50&page=1からすべてのテーブルを取得しようとしていますが、目的のテーブルを取得できません。代わりに、最初の 2 つのテーブルのみを取得しますが、これは役に立ちません。

これが私のコードです:

出力:

このように、すべてのテーブルではなく、最初の 2 つのテーブルのみを取得します。

0 投票する
2 に答える
15259 参照

jquery - jqueryを使用してTDセル値を取得する方法

クラス user と id を持つ最初と 2 番目の TD からテキストを取得したいと思います

このjQueryコードを試しましたが、うまくいきませんでした:

GL552VW-CN426Tの 2 番目のtdタグ内から取得したいtr