問題タブ [httr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 同時リクエストに基づく RCurl クローラーの問題
以下は、同時リクエストを実行する RCurl を使用してクローラーを構築するときに直面している問題を再現するためのスクリプトです。目的は、統計分析を実行するために数千の Web サイトのコンテンツをダウンロードすることです。したがって、ソリューションはスケーリングする必要があります。
質問:
クロールする必要があるWebページの量を考えると、RCurlは同時リクエストをサポートしているため、RCurlを使用したいと思います。getURL/getURLs バージョンが失敗した場合に、GET() バージョンとして機能するように getURLs() 呼び出しを改善することは可能でしょうか。
アップデート:
問題をより適切に再現するために、より多くのデータ (990 uris) を含む Gist を追加しました。
実行後:
次のエラーが表示されます。
getURIAsynchronous の使用:
同様のエラーが表示されます: nchar(str) のエラー: 無効なマルチバイト文字列 1
更新 2
以下を試した後:
その結果、最初の 225 個の URL に対しては適切に機能し、その後は Web サイトから cero コンテンツを返すだけです。これは null エラーの問題ですか?
r - 式の前に部分文字列を使用して、XPath 1.0 と RCurl と httr で結果が異なる理由
式で XPath 1.0 の substring-before または -after を使用すると、後続の xmlValue 呼び出しでエラーが発生します。以下のコードは、XPath 式が httr では正常に機能するが、RCurl では機能しないことを示しています。
上記のコードは正常に動作しますが、substring-before を使用して、次のように結果をクリーンアップしたいと考えています。
substring-
RCurl は、後で使用するより複雑な操作のために選択されたパッケージであるため、RCurlを使用するにはどうすればよいですか?
ガイダンスに感謝します(または、私が望むものを達成するためのより良い方法
r - Rでファイルの最終更新日を変更する
ファイルのローカル バージョンのサイズが異なる場合にのみ S3 データ リポジトリからファイルをダウンロードして、帯域幅と時間を節約する小さな関数を作成しました。
最終更新日時が異なる場合にのみダウンロードするように改善したいと思います。HEAD
(httrパッケージから)を使用してチェックを行い、リモートファイルとfile.info
ローカルファイルの日時を取得できます。
しかし、(見たとおり)ファイルの新しいコピーをダウンロードすると、作成/最終更新時刻としてSysdateが表示されます。異なるタイムゾーンによる潜在的な問題を含め、新しいローカルコピーの日時をサーバーからのもので更新する方法が必要です。
file.info はファイルのプロパティを書き込めないようです。
どうすればそれを行うことができますか?
r - R ネゴシエート認証 (RCurl または Httr を使用)
RCurl を使用して R から Web サービスにアクセスしようとしています。Web サービスは Kerberos 認証を使用します。
コマンドラインでcurlを使用したテストは正常に機能します。
ただし、RI では機能させることができません。
httpauth
に設定されたオプションも使用しようとしましたgssnegotiate
が、それも失敗します。
httr - Why does httr fail on the MusicBrainz webservice?
When I visit http://musicbrainz.org/ws/2/artist/?query=artist:Sun+Ra in my web browser I get the kind of response I'm expecting.
But when I
the response body is empty, even though sun.ra
got status 200:
Does httr
have a problem with "naked" XML responses?
This XML file does not appear to have any style information associated with it.
(I actually think I've figured out the answer, just still going to post the question and answer myself in case someone else has the same problem later…)
r - httr を使用して URL コンテンツを取得するために Cookie を適切に設定する方法
Cookie を使用して保護されている Web サイトから情報をダウンロードする必要があります。この保護を手動で渡し、Cookie を に挿入しhttr
ます。
同様のトピックがありますが、私の問題は解決しません: ( httr の Cookie をコピーする)
そのため、コンテンツを使用すると、ログインしていないという情報が返されます(Cookieなしで行うように)
どうすればこの問題を解決できますか?
テスト資格情報は login: mytest2
、 pass: qwerty12
)
r - RCurl または httr への curl POST ステートメント
Nokia の HERE バッチ ジオコーディング サービスにファイルを投稿するには、この作業用の curl ステートメントがあります...
私はこれを試しました:
この:
このファイルを次のように使用しますexample.txt
: https://gist.github.com/corynissen/4f30378f11a5e51ad9ad
Rでこのプロパティを実行する方法はありますか?