問題タブ [google-scholar]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3286 参照

internal-server-error - Google サーバーは、プライベート ブラウジング モードでの最初のリクエストでサーバー エラーを返します

https://scholar.google.com/citations?user=N7m4vIQAAAAJ&hl=enSafari と Google Chrome のプライベート ウィンドウでURL を実行すると、Google でエラーが発生します。

プライベート ブラウジング モードでの最初のリクエストでのみ発生します。

これが特定の環境でのみ発生する理由を知っている人はいますか? これは 3 日前から発生しています。

-- エラー メッセージとキャプチャ

Server Error We're sorry but it appears that there has been an internal server error while processing your request. Our engineers have been notified and are working to resolve the issue. Please try again later.

ここに画像の説明を入力

ここに画像の説明を入力

- - 追加した

ヘッダーファイルには次のものが含まれます

http header response Cache-Control: no-cache, must-revalidate Content-Encoding: gzip Content-Type: text/html; charset=UTF-8 Date: Mon, 16 Nov 2015 19:35:39 GMT Expires: Fri, 01 Jan 1990 00:00:00 GMT Pragma: no-cache Server: citations Set-Cookie: NID=73=eF98qod1NpYg7nb03RUToiSiacFgqNoZxQ4CuzqwGlQn53SoR7rHlzO0OExsmYkpRazROCQ3WqKoCsWKFPxp8dZr5pBra6nD1HPcxWUILl9gVAf5Q7GSQc3B0O3TP4gu; expires=Tue, 17-May-2016 19:35:39 GMT; path=/; domain=.google.com; HttpOnly X-Firefox-Spdy: h2 X-Frame-Options: SAMEORIGIN X-XSS-Protection: 1; mode=block p3p: CP="This is not a P3P policy! See http://www.google.com/support/accounts/bin/answer.py?hl=en&answer=151657 for more info." x-content-type-options: no sniff

0 投票する
0 に答える
1067 参照

php - Google Scholar での Web スクレイピング

Google Scholar プロファイル ページからスクレイピングしようとしています。アイデアは、XPath を使用して出版物のリストを取得したいということですが、ページをダウンロードしません。コードは次のとおりです。curl で試しました

そしてカールなし:

カールなしで取得するには

curlで取得するには

その後

しかし、 $autori は空のままです。

0 投票する
0 に答える
424 参照

python - Pythonリクエストを使用したGoogle Scholarでのリクエストの失敗

Python requestsモジュールを使用して URL からテキストを取得しようとしたときに問題が発生しました。

学術論文の bibtex の URL をなんとか見つけた後、bibtex を含むテキストを取得するのに問題があります。

例として、いくつかの Python コード行を使用して、次の bibtex を含むこのリンクを取得します。

@article{milgrom1994monotone, title={Monotone comparison statics}, author={ミルグロム, ポールとシャノン, クリス}, journal={Econometrica: 計量経済学会誌}, pages={157--180}, year={1994 }、パブリッシャー={JSTOR}}

以下のコードを使用してテキストを抽出することはできません。

ここで、Google Scholar は「 https://scholar.google.com.br 」を含む文字列であり、URL は「/scholar.bib?q=info:46dohauatq8J:scholar.google.com/&output=citation&hl=en&ct=citation&cd=0」です。 "。

Google Chrome に完全な URL をコピーして貼り付けると正常に動作するため、何かが足りないように感じます。つまり、エラー メッセージを発行する代わりにページを開きます。

0 投票する
1 に答える
1150 参照

python - Python の学術モジュールを使用した検索クエリ中の StopIteration

Python2.7 の学術モジュールを使用して、Google Scholar から特定の論文の詳細を取得しようとしています。1000件の論文の詳細を収集したいと思い、以下のコードを書きました。

10〜12回の反復後にエラーが発生します

Stackoverflow で利用可能ないくつかの回答を調べましたが、修正できませんでした。

StopIteration エラーの修正を手伝ってください

0 投票する
2 に答える
128 参照

python - スクレイプ Google Scholar セキュリティ ページ

次のような文字列があります。

私はこれに変換したい:

私はこれを試しました:

ただし、次のエラーがスローされます。

0 投票する
2 に答える
1616 参照

python - Google Scholar をスクレイピングする際の 503 エラーを防ぐ

Google Scholar セキュリティ ページからデータをスクレイピングするために、次のコードを作成しました。. ただし、実行するたびに次のエラーが表示されます。

これは、GS が私のリクエストをブロックしているためだと思います。どうすればこれを防ぐことができますか?

コードは次のとおりです。