問題タブ [webharvest]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - WebHarvest は 1 つの要求で 50 の結果が必要です
私はこの言語に不慣れで、単純な作業で立ち往生しています。
基本的には、サーチャーが基本的な結果として提供する基本的な 10 件の結果ではなく、50 件の結果を取得したいと考えています。これはコードになります:
どうすればこれを解決できるか教えてもらえますか!? お願いします!!
web - Google画像で大きな写真を取得する方法
Google画像検索で画像を集めたい。ただし、常にエラーが通知されます。
たとえばhttps://www.google.com/search?q=banana&hl=en&gws_rd=ssl&tbm=isch、私のブラウザでは URL に問題はありませんが、Web ハーベストでは次のように報告されます。エンティティ「gws_rd」への参照は「;」で終了する必要があります。デリミタ。
「&」は webharvest の特殊文字だと思いますが、それに関する情報は見つかりません。理由がわかりますか?
これはコードです:
webharvest - WebHarvest を使用して Child Link の情報を取得しようとしています
各子リンクの情報を取得したいのですが、プログラムでエラーが表示されます。以下は私の完全な設定ファイルです。エラーの原因: org.xml.sax.SAXParseException; 行番号: 6; 列番号: 724; 要素タイプ「t.length」の後には、属性指定「">」または「/>」が続く必要があります。**
webharvest - WebHarvestから抽出した後に文字列を置き換える方法は?
Web サイトから抽出したレコードを DB に挿入したかったのですが、抽出テキストに記号アポストロフィが含まれていたため、SQL 挿入中に構文エラーが発生しました。WebHarvest でアポストロフィーを "'" に置き換える方法を教えてください。
前もって感謝します!
webharvest - Webharvest クローラー スクリプトが XML ファイルを作成しない
誰かがこのスクリプトに関する私の (おそらくばかげた) 問題を指摘してくれることを願っています。Web サイトをクロールして、サイト上の投稿を取得し、これを XML ドキュメントにロードしようとしています。私はいくつかのサンプル スクリプト (クローラーと nytimes の例) を組み合わせようとしました。
スクリプトはエラーなしで実行されますが、<edublogs date="02.10.2015"></edublogs>タグのみがエクスポートされます。
よろしくお願いします。
r - Rで共有数をWebスクレイプする方法
この Web サイトhttp://www.r-bloggers.com/erum-2016-first-european-conference-for-the-programming-language-r/の左の SumoMe プラグインからシェア カウントをダウンロードしようとしています。
rvestパッケージに基づいてRコードを使用しようとしています
しかし、空の応答を受け取りました。このページは、共有数が 0 から始まっているように見えますが、その Web サイトに時間を費やしてから数秒後に更新されます。誰かがそれに対する可能な解決策を提案したり、パッケージにアドバイスしたりできますか? RSeleniumはそのための良いパッケージですか? 私は前にそれを使用したことがありません。
html - divの後のテキストのXPath?
XPath 1.0/2.0 で数値 "-105" を抽出するにはどうすればよいですか?
私は試しました:
variables - 変数取得時の XSLT エラー
変数を xsl ファイルに割り当て、後でこのファイルで使用しようとしています。
これが私がそれらを割り当てる方法です:
そして、私がそれらを使おうとすると
エラーが発生しました!なんで?
のみを削除すると
大丈夫です。そのため、変数に正しくアクセスしていないようです。