問題タブ [webharvest]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
312 参照

xml - WebHarvest は 1 つの要求で 50 の結果が必要です

私はこの言語に不慣れで、単純な作業で立ち往生しています。

基本的には、サーチャーが基本的な結果として提供する基本的な 10 件の結果ではなく、50 件の結果を取得したいと考えています。これはコードになります:

どうすればこれを解決できるか教えてもらえますか!? お願いします!!

0 投票する
1 に答える
399 参照

web - Google画像で大きな写真を取得する方法

Google画像検索で画像を集めたい。ただし、常にエラーが通知されます。

たとえばhttps://www.google.com/search?q=banana&hl=en&gws_rd=ssl&tbm=isch、私のブラウザでは URL に問題はありませんが、Web ハーベストでは次のように報告されます。エンティティ「gws_rd」への参照は「;」で終了する必要があります。デリミタ。

「&」は webharvest の特殊文字だと思いますが、それに関する情報は見つかりません。理由がわかりますか?

これはコードです:

0 投票する
1 に答える
117 参照

webharvest - WebHarvest を使用して Child Link の情報を取得しようとしています

各子リンクの情報を取得したいのですが、プログラムでエラーが表示されます。以下は私の完全な設定ファイルです。エラーの原因: org.xml.sax.SAXParseException; 行番号: 6; 列番号: 724; 要素タイプ「t.length」の後には、属性指定「">」または「/>」が続く必要があります。**

0 投票する
1 に答える
113 参照

webharvest - WebHarvestから抽出した後に文字列を置き換える方法は?

Web サイトから抽出したレコードを DB に挿入したかったのですが、抽出テキストに記号アポストロフィが含まれていたため、SQL 挿入中に構文エラーが発生しました。WebHarvest でアポストロフィーを "'" に置き換える方法を教えてください。

前もって感謝します!

0 投票する
1 に答える
150 参照

webharvest - Webharvest クローラー スクリプトが XML ファイルを作成しない

誰かがこのスクリプトに関する私の (おそらくばかげた) 問題を指摘してくれることを願っています。Web サイトをクロールして、サイト上の投稿を取得し、これを XML ドキュメントにロードしようとしています。私はいくつかのサンプル スクリプト (クローラーと nytimes の例) を組み合わせようとしました。

スクリプトはエラーなしで実行されますが、<edublogs date="02.10.2015"></edublogs>タグのみがエクスポートされます。

よろしくお願いします。

0 投票する
1 に答える
138 参照

r - Rで共有数をWebスクレイプする方法

この Web サイトhttp://www.r-bloggers.com/erum-2016-first-european-conference-for-the-programming-language-r/の左の SumoMe プラグインからシェア カウントをダウンロードしようとしています。

rvestパッケージに基づいてRコードを使用しようとしています

しかし、空の応答を受け取りました。このページは、共有数が 0 から始まっているように見えますが、その Web サイトに時間を費やしてから数秒後に更新されます。誰かがそれに対する可能な解決策を提案したり、パッケージにアドバイスしたりできますか? RSeleniumはそのための良いパッケージですか? 私は前にそれを使用したことがありません。

0 投票する
1 に答える
394 参照

html - divの後のテキストのXPath?

XPath 1.0/2.0 で数値 "-105" を抽出するにはどうすればよいですか?

私は試しました:

0 投票する
0 に答える
140 参照

variables - 変数取得時の XSLT エラー

変数を xsl ファイルに割り当て、後でこのファイルで使用しようとしています。

これが私がそれらを割り当てる方法です:

そして、私がそれらを使おうとすると

エラーが発生しました!なんで?

のみを削除すると

大丈夫です。そのため、変数に正しくアクセスしていないようです。