Webページスクレーパーを作成しています。XPathを使用して取得したページ上のデータからJTableに入力しようとしています。単一行のデータを配列に入れたい。
{"Name","Phone","Address","City","State","Postal Code","Link"}
解析する文字列にWebページを取得します。\ nはありません(申し訳ありませんが、これに適切な単語がわかりません。新しい行ですか?)
配列は、列のデータを表します。私がやりたいのは、その行の個々のデータ行を取得し、それを配列に挿入してから、JTableに配置するようにすることです。次に、配列がnullに設定され、プロセスが繰り返されます。
私が本当に扱いたくないもう1つのオプションは、個々のセルすべてを各列の配列リストに配置してから、whileループを実行することです。これに関する問題は、エントリが空を返す可能性があることです。これは、インデックスが完全に同期されていない可能性があることを意味します。
私はかなり「新しい」プログラマーであり、実際にほとんどのことを自分で行った経験が約6か月あります。私はまだ方法論の構築に取り組んでいますが、ここで立ち往生しています。
この状況で最善の解決策は何でしょうか。おそらく、私が考えていなかったより良い解決策があるでしょう。
これは生のコードの問題ではなく、フローの問題です。
散らかっています、はい。ただし、GoogleDocsのxPathおよびImportXML関数を使用してクロールするのは非常に簡単でした。
これが私がセルに入れるものです:
名前:
=importxml("http://www.yellowpages.com/[location]/[type]","//a[@class='no-tracks url ']")
住所:
=importxml("http://www.yellowpages.com/[location]/[type]","//span[@class='street-address']")
電話:
=importxml("http://www.yellowpages.com/[location]/[type]","//span[@class='business-phone phone']")
私は他のことをしませんでした、しかし私はそれが可能であることを知っています。
プライバシー上の理由からHTMLの例を削除しました。申し訳ありません。