問題タブ [html-tableextract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
css-selectors - 「スレッド」に基づいて HTML テーブル コンテンツを抽出する
以下は基本的な HTML テーブルです。
ソース ファイルにそのようなテーブルがいくつかあるとします。のオプションhxextract
、または CSS3 セレクターhxselect
、または他のツールで使用できるものはありますthead
か? それとも、それほど単純ではないawk
(または、送信前に見つかったperlの可能性がある) スクリプトで立ち往生していますか?
更新:
コンテンツベースの抽出の場合、perlHTML::TableExtract
はトリックを行います:
ただし、場合によっては、単純なlynx -dump mywebpage.html
結合 wihawk
などでも同じくらい効率的です。
perl - 複数のファイルの特定の文字列を含むすべての HTML テーブルを印刷する (perl)
ディレクトリ内の各 xml ファイルの文字列「kcat」を含むすべての HTML テーブルを印刷しようとしていますが、問題が発生しています。ディレクトリ内の各ファイル (kcat_tables という名前) には、kcat を含む HTML テーブルが少なくとも 1 つあることに注意してください。このプログラムを ubuntu 仮想マシンで実行しています。これが私のコードです:
これを修正する方法についてのアイデアはありますか? 前もって感謝します!また、私はPERL言語にかなり慣れていないので、シンプルでわかりやすい回答をいただければ幸いです。
html - HTML テーブルの解析/抽出、Java での Web サイト
この HTML テーブルの内容を解析したい:
ソースコード付きの完全なウェブサイトは次のとおりです。
http://www.kantschule-falkensee.de/uploads/dmiadgspahw/klassen/A_Klasse_11.htm
例として、「モンタグ」(月曜日)の下の5つのセルすべての各セルのデータを解析したいと思います。JSOUP を使用してこの Web サイトを解析する方法をいくつか試しましたが、うまくいきませんでした。私の主な目標は、Android アプリのリストビューにコンテンツを表示することです。今のところ、Java コンソールで内容を印刷しようとしました。両方の言語が受け入れられます:)。どんな助けでも大歓迎です。
excel - VBA Web スクレイピング
このウェブサイトのこのテーブルからデータの行を取得しようとしています: http://www.nasdaq.com/symbol/neog/financials?query=balance-sheet
これで、次を使用して「総負債」行を取得できます
しかし、普通株などの他のデータ行を取得する方法がわかりません。
それが役立つ場合は、取得したい HTML ソースと強調表示された tr があります。
問題は、テーブルの行データを見つける方法です。他の行のデータを取得する方法を誰かに説明してもらえますか? よろしくお願いします!
html - readHTMLTable はデータフレーム値を整数として返します
列名をその行の文字列に設定する代わりに、下のマークされた行が数値を返す理由を誰かが説明できますか? colClasses
テーブルを読むときにコメントアウトされた行を含めると、正しい列名を取得するにはどうすればよいですか?
html - perlでウェブサイトから特別な種類のテーブルを抽出するにはどうすればよいですか?
Perl モジュール HTML::TableExtract を使用して、Web サイトhttp://finance.yahoo.com/etf/lists/?bypass=true&mod_id=mediaquotesetf&tab=tab1&scol=imkt&stype=desc&rcnt=50&page=1からすべてのテーブルを取得しようとしていますが、目的のテーブルを取得できません。代わりに、最初の 2 つのテーブルのみを取得しますが、これは役に立ちません。
これが私のコードです:
出力:
このように、すべてのテーブルではなく、最初の 2 つのテーブルのみを取得します。
jquery - jqueryを使用してTDセル値を取得する方法
クラス user と id を持つ最初と 2 番目の TD からテキストを取得したいと思います
このjQueryコードを試しましたが、うまくいきませんでした:
GL552VW-CN426T
の 2 番目のtd
タグ内から取得したいtr
。