問題タブ [google-scholar]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-scholar - Google 学者のバッチ検索を実行して、結果の数だけを取得するにはどうすればよいですか?
Scholar.google.com (染色体領域のリスト) で検索したいものの大きなリストがあり、各検索用語の結果の数だけが必要です。これを行う最善の方法を知っている人はいますか?
google-scholar - Google Scholar で価格検索エンジンのアルゴリズムに使用するキーワードは何ですか?
修士論文のために価格検索エンジンをやろうと思っています。文献を検索する必要があります。私の主な言語は英語ではなく、検索する正しいクエリが見つかりません。ご協力いただければ幸いです。
私が探しているのは、製品を分類するためのアルゴリズムです。アイデアは、一致する商品を見つけてクラスに割り当てることで、Google ショッピングと同じように価格で商品を並べ替えることができます。
r - rを使用してGoogleScholarで検索結果をダウンロードするにはどうすればよいですか?
Rを使用してGoogleScholar検索の最初の100件の結果(たとえば)を抽出したいと思います。誰かがそれを行う方法を知っていますか?
正確には、論文の名前、著者、引用数だけが必要です。
追伸これは合法ですか?
c# - プログラムでGoogle Scholarにクエリを実行する方法は?
キーワードを入力として受け取り、そのキーワードを使用して Google Scholar にクエリを実行し、そのキーワードを含むジャーナルをダウンロードする関数を開発したいと考えています。
今のところ、オブジェクトを使用する従来の方法は避けたいと思いWebRequest
ます。
残念ながら、Google は Scholar にクエリを実行するための API を提供していないようです。
私は c# を使用しています。
wolfram-mathematica - MathematicaとGoogleの学者を使って学術研究情報を抽出する簡単な例を誰かが共有できますか?
MathematicaとGoogleの学者を使って、2011年に出版された論文の数を見つけるにはどうすればよいですか?
captcha - GooglescholarCaptcha検証の問題
GoogleScholarからデータを抽出する必要があるプロジェクトに取り組んでいます。私のPHPプログラムは、ローカルマシンから文字列を取得し、それをGoogle Scholarに渡し、検索結果ページで最初の結果を取り出してデータベースに保存します。
私はこれをほぼ9万の文字列/クエリに対して実行する必要があります。問題は、数百のエントリの後、Google Scholarがキャプチャの検証を要求すると、プログラムが停止することです。私はそれについて何ができますか?
python - Pythonでプロキシ経由でwget呼び出しを行う方法は?
このスクリプトpdfmeatを使用して、GoogleScholarから論文に関するデータを取得しようとしました。
このスクリプトは私のPCで非常にうまく機能しますが、このスクリプトをサーバーに配置しようとすると、結果が得られません。私のサーバーがGoogleScholarのブラックリストに含まれている可能性が非常に高いことがわかりました。エラーが発生した場合は、エラーが発生します(チャプタを解決するためにリダイレクトされます)。
次に、wget --execute "http_proxy=urltoproxy"にオプションがあることがわかりました。私はそれをしました
そして私はグーグル学者からindex.htmlを保存することができました。
次に、pdfmeat.pyで同じことを試みましたが、どちらも結果がありません。
これはコードです:
スクリプトはモジュールosを使用します。元の関数には、wgetの--executeオプションがありません。
前もって感謝します
matlab - Matlabを使用したGoogleScholar
matlabスクリプトを介してGoogleScholarからいくつかのデータを自動的に取得したいと思います。私は主に、GoogleScholarのBibtexエントリや前方引用機能などのデータに興味があります。ただし、Google Scholar用のAPIはないようですが、Matlabを使用してGoogle Scholarから書誌データを自動的に取得する方法はありますか?このためにすでに利用可能なツールやコードはありますか?
php - PHP を使用して Google Scholar から bibtex をダウンロードする方法はありますか
こんにちは、BibTeX を 1 つずつ手動でダウンロードすることなく、PHP を使用して Google Scholar から何かの BibTeX エントリをダウンロードする方法はありますか? たとえば、「research」のような検索値を設定し、コードを介してリンクから関連する BibTeX を自動的にダウンロードします。
どんな助けでも大歓迎です。HTML ページを取得しようとしましたが、ページ コンテンツを取得しようとすると、取得したページ コンテンツで [BibTeX にインポート] リンクが消えます。
私のコード:
python - tor と python を使用して Google Scholar をスクレイピングする
私は、ジャーナル記事がどのように引用されているかを分析するプロジェクトに取り組んでいます。ジャーナル記事名の大きなファイルがあります。それらを Google Scholar に渡して、それぞれの引用数を確認するつもりです。
これが私が従っている戦略です:
http://www.icir.org/christian/scholar.htmlの「scholar.py」を使用します。これは、Google Scholar を検索し、最初にヒットした情報 (引用数を含む) を CSV 形式で返す、事前に作成された Python スクリプトです。
Google Scholar は、一定数の検索後にあなたをブロックします (クエリする記事のタイトルは約 3000 あります)。この問題を解決するために、ほとんどの人が Tor ( Tor を介して urllib2 リクエストを Python で作成する方法は?およびカスタム Web クローラーがブロックされないようにする方法) を使用していることがわかりました。Tor は、数分ごとにランダムな IP アドレスを提供するサービスです。
私は Scholar.py と tor の両方を正常にセットアップして動作させています。私は python やライブラリ urllib2 にあまり詳しくありません。クエリが Tor を介してルーティングされるように、scholate.py にどのような変更が必要か疑問に思っています。
大量の Google 学者のクエリに対するより簡単な (そして潜在的にかなり異なる) アプローチが存在する場合は、その提案にも従います。
前もって感謝します