問題タブ [rvest]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1532 参照

r - RStudio で VIN 番号のメーカー/モデル/年を Web スクレイピングする

私は現在、製造元、モデル、および VIN 番号の年を見つける必要があるプロジェクトに取り組んでいます。300 の異なる VIN 番号のリストがあります。個々の VIN 番号を確認し、製造元、モデル、および製造年を手動で Excel に入力するのは、非常に非効率的で面倒です。

このサイトをスクレイピングして情報を取得するために、SelectorGadget で Rvest パッケージを使用して R で数行のコードを記述しようとしましたが、成功しませんでした: http://www.vindecoder.net/?vin=1G2HX54K724118697&submit=Decode

これが私のコードです:

VINhtml を実行しようとすると、次のエラー メッセージが表示されます: list() attr(,"class") [1] "XMLNodeSet"

何が間違っているのかわかりません。動的な Web ページであるため機能していないと思いますが、間違っている可能性があります。この問題に取り組むための最良の方法について何か提案はありますか?

私はまた、これを理解するために他のウェブサイトや代替アプローチを使用することにもオープンです. これらの VIN のモデル、メーカー、モデル年を知りたいだけです。これを行う効率的な方法を見つけるのを手伝ってくれる人はいますか?

Here is some sample VINs: YV4SZ592561226129 YV4SZ592371288470 YV4SZ592371257784 YV4CZ982871331598 YV4CZ982581428985 YV4CZ982481423003 YV4CZ982381423543 YV4CZ982171380593 YV4CZ982081460887 YV4CZ852361288222 YV4CZ852281454409 YV4CZ852281454409 YV4CZ852281454409 YV4CZ592861304665 YV4CZ592861267682 YV4CZ592561266859

0 投票する
2 に答える
523 参照

r - ローカル ホストとの接続を確認する

私は SPSS ラベルを R に読み込む方法を作成しています変数名の列と探しているラベルを含む素敵なテーブルを示しています。

rvest を使用してスクレイピングしたいのですが、page <- rvest::html("http://localhost:11773/session/file1e0c67270a5.html")R などのコマンドで開始すると、動かなくなったようです。

「ローカル ホストに接続」で検索してみましたが、R パッケージに関する質問や回答が見つからないようです。

0 投票する
1 に答える
1436 参照

r - rvest を使用したデータのスクレイピング

以下のコードを使用して、このページから各検索結果の名前を取得しようとしています。

ただし、次のように返されます。

これを修正する方法について何か考えはありますか?助けてくれてありがとう!

0 投票する
1 に答える
801 参照

r - R - 求人掲示板のWebスクレイプ

Indeed.com の求人掲示板から、テーブル内の会社と求人のリストを取得しようとしています。

http://www.indeed.com/jobs?q=proprietary+trader&の URL ベースを使用して rvest パッケージを使用しています。

そして、連結をループします。何らかの理由で、すべてのジョブを取得するわけではなく、企業とジョブを混合します。

0 投票する
1 に答える
134 参照

r - rvest セクションの見出しをテーブルに渡す

rvest野球の順位表に慣れようとしているときに、@Cory親切にも、部門ごとに 1 つのテーブルがあるサイトを教えてくれました。(野球は2リーグ×各3ディビジョン=6テーブル)。

ただし、これらの表にはリーグとディビジョンの列は含まれていません。その情報は、セクションの見出し<h4><h5>表の上にあります。

リーグと部門を半手動で割り当てることができることを知っています。

<h4>この構造が変わるとは思えないので、手動の割り当てで問題ありません...しかし、考えさせられました..各テーブルにandの最新の値を継承/ルックバックさせ、<h5>列として保存する賢い方法はありますか?

TYVM

0 投票する
1 に答える
3922 参照

xml - rvest の html と XML の htmlParse

次のコードが示すように、htmlin rvestpackage はhtmlParsefrom XMLpackage を使用します。.

したがって、次の URL の場合:

何か案が?

0 投票する
0 に答える
427 参照

r - httr/rvest を使用して javascript/jQuery を POST に変換する

Web ページをスクラップしようとしています。この Web ページのデータの一部は、次のスクリプトを使用して更新されます。

それで、私の質問は、Chart_Guide関数を使用して表示されるテーブルとグラフに基づいて、このデータ(JSON)を取得する方法です?

私は次のことを試しました(上記のスクリプト要素のテキストを解析しています):

次に、次の方法で rvest と httr を使用しました。

それから私は試しました:

そしてそれはすべて失敗します...

このタスクを達成する方法についての提案は高く評価されます。

0 投票する
2 に答える
1406 参照

r - R と rvest による Web スクレイピング

rvestR を使用した Web スクレイピングを学習するために実験を行っています。ページの他のいくつかのセクションで Lego の例を複製し、 selector gadgetto id を使用しようとしています。

R Studio tutorialから例を引き出しました。以下のコードでは、1 と 2 は機能しますが、3 は機能しません。