問題タブ [google-sheets-importxml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
36 参照

google-sheets - NCBI Web サイトの特定のページで IMPORTXML が #N/A を返す - スクレイピングは保護されていますか?

このページhttps://www.ncbi.nlm.nih.gov/gene/2597をスクレイピングして、「公式フルネーム」、「別名」、およびその他の情報を を使用して Google シートに取得しようとしていIMPORTXMLます。

「正式な氏名」(e.g. glyceraldehyde-3-phosphate dehydrogenase)については、次のようにします。

私に #N/A を与える

だから私は、URLとクエリを入れたセルを使用して、可能な限りすべての方法でクエリを変更しようとして""''ます:D.

IMPORTHTML使用できる(ページ内のテーブルに関する情報がある) かIMPORTRSS、必要な情報を取得できないことに気付きました。したがって、ウェブサイトはスクレイピングをブロックしていないと思います。

私はそれが JS または XML の問題だと思っていましたが、そうではないようです (私の意見では...何かを見逃したのかもしれません)。私IMPORTJSONは誰かのコードから使用しようとしましたが、何も取得できません (正直に言うと、複雑すぎて使用できない可能性があります)。

私は本当にここでブロックされているので、誰か助けてくれませんか?