問題タブ [rjsonio]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 複数行の JSON データをインポートし、R でデータ フレームに変換する
次の JSON データがあるとします。
JSON データを R にインポートし、最終的に R データ フレームに変換しようとしています。
R に次のスクリプトがあるとします。
このスクリプトを実行すると、JSON データは、JSON データ ファイルの最初の行を含むデータ フレームのみを生成します。約200行あります。私が認識している問題の 1 つは、JavaScript が複数行の文字列を「許可」しないことです。私はさまざまな方法でこれに対処しようとしました:
- データの各「行」の間に「"」を追加します。
- データの各「行」の末尾に「"」を追加します。
- データの各「行」の間に「\」を追加します。
- データの各「行」の末尾に「\」を追加します。
- 複数の行をすべて 1 行に変換します (「\n」を「\n」に置き換えます)。
上記のすべては、正規表現を使用して試みられました。
私の質問は次のとおりです。データのすべての「行」がRに読み込まれるようにJSONデータを操作して、それらをリストから外し、「タイトル」、「テキスト」に等しい列を持つ適切なデータフレームを構築するにはどうすればよいですか? 、「url」、行は JSON データの「行」と同じですか?
R の RJSON ライブラリと RJSONIO ライブラリの両方を使用してこれを試みましたが、最終的に問題は JSON データ自体のフォーマットにあると考えているため、現時点でどちらを使用するかについては曖昧です。
json - RJSONIO パッケージの fromJSON の奇妙な動作
OK、次の JSON データを R データ フレームに変換しようとしています。
何らかの理由で、RJSONIO パッケージの fromJSON は 380 文字程度までしか読み取れず、JSON の適切な変換が停止します。
JSON は次のとおりです。
ここに私のR出力があります
(出力を少し切り捨てました)。
R 出力は「callConversionPerc」まで適切に読み取られ、その後 JSON 解析が壊れているようです。この動作を引き起こす可能性がある、見逃したデフォルトのパラメーターはありますか? マスクされていないスピーチマークと、そのような明白なものを確認しました。
確かに、直後に発生するのは改行演算子ではないでしょうか?
編集:したがって、これは改行の問題のようです。
これは、私が R に取り込んだ別の「JSON」文字列です。ここでも、二重引用符はすべてエスケープされています
を使用してこれを解析しようとするとfromJSON
、同じ問題が発生します。最初の行の最後の用語に到達し、適切に解析を停止します。この新しいケースではNULL
、最後の項目を返す前とは出力が少し異なることに注意してください (前の例の乱雑な文字列ではありません。
ご覧のとおり、コンポーネントは、コンポーネントに名前を付けて最後の項目が null であるかのように "$" 規則を使用するようになりました。
これが文字列を解析する方法に関係しているかどうか疑問に思ってfromJSON
おり、既に存在する変数と同じ名前の変数を作成するように求められた場合、それは失敗し、文字列または NULL を返します。
JSONデータが繰り返し名前を持つことは非常に標準的であるため、そのようなケースを処理することはRJSONIOにコード化されると思っていました。
これを修正する方法に困惑しています。
json - データフレームの列ヘッダーとして JSON スキーマを使用する
わかりました、以前の質問 ( here )に従って、JSON データのロードを R に読み込み、データをデータ フレームに取得することができました。ここにコードがあります: -
これにより、次のようなデータフレームが得られます:-
ただし、データ フレームには列名がありません。JSONオブジェクトで「名前」を検索すると、Rは「NULL」を返すため、何も役に立ちません。
JSON スキーマから列ヘッダーの名前を取得する簡単な方法 (より一般的なケースで再現可能) があるかどうか疑問に思っています。
サイトの他の場所にも同様の質問があることは承知していますが、これはカバーされていないようです.
編集:コメントによると、ここにcontJSON
オブジェクトの構造があります。
r - 日付形式を含む JSON オブジェクトを作成する方法
JSONに変換したいRの名前付きリストがあります(MongoDBのドキュメントとして送信するため)
単に toJSON を実行すると、2 番目の要素の日付形式が失われます (数値に変換されます)。
どうすれば入手できますか:
?
JSONIO パッケージのドキュメントには、このようなものは見つかりませんでした。
html - ウェブサイトから人口データを抽出する; ウィキタウンのウェブページ
皆様、
オーストラリアの人口/居住地のラスター レイヤーを探しています。オンラインでいくつかの無料のデータセットを見つけようとしましたが、実際に有用な形式のものを見つけることができませんでした. ウィキペディアから人口データをスクレイピングして、独自のラスター レイヤーを作成するのは面白いのではないかと思いました。この目的のために、wiki から情報を取得しようとしましたが、html について何も知らなかったことが役に立ちませんでした。
アイデアは、wiki ページを持つオーストラリアのすべての町のリストを提供し、適切なデータを data.frame に抽出することです。
Web ページのソース データを R に取り込むことはできますが、必要な特定のデータを抽出する方法に行き詰まっています。以下のコードは、私がどこで立ち往生しているかを示しています。助けがあれば本当に感謝するか、正しい方向へのヒントが得られます。
readHTMLTable() を使用できるかもしれないと思ったのは、通常の Web ページでは、必要な情報が適切な表の右にずれているためです。しかし、この関数を使用するとエラーが発生します (以下)。ソース情報を取得するときにこのテーブルを指定する方法はありますか?
この質問があまり意味をなさない場合は申し訳ありませんが、HTML ファイルの検索に関して自分が何をしているのかわかりません。
ご協力いただきありがとうございます。
乾杯、アダム
readHTMLTable 使用時のエラー:
たとえば、必要なデータの一部は、html で次のようになります。私の質問は、私が持っている HTML のものでこれらの場所を指定するにはどうすればよいですか?