0

単一のオブジェクトと約 100 行を含む json 行の形式のサンプル抽出があります。1行あたり約800項目あります。

データのサンプルを次に示します。

Row 1 - {"Id":"User1","OwnerId":"OwnerID1","IsDeleted":false,"Name":"SampleName1", etc...}

Row 2 - {"Id":"User2","OwnerId":"OwnerID2","IsDeleted":true,"Name":"SampleName2", etc...}

これを次のようなデータフレームに変換したい:

Id     | OwnerId     |  IsDeleted | Name         |  etc..
User1  | OwnerID1    |  false     | SampleName1  |  etc..
User2  | OwnerID2    |  true      | SampleName2  |  etc..

dplyr と tidyr を試してみましたが、うまくいきませんでした。

これを処理する最適な方法は何ですか?

これを解決するには、まず JSON バリデーターを使用してデータを解析し、データのフォーマットを修正しました。データを「適切な」JSON 形式に変換したら、R でデータ フレームとして使用するのは非常に簡単でした。

他のユーザーから提案されたjsonLiteを使用しましたが、すべてうまくいきました。

install.packages("jsonlite")
library(jsonlite)
KafkaDF <- fromJSON("Kafka_Formatted_Full.JSON")

データ構造のため、マトリックスへの変換が必要でした。

KafkaDFM = as.matrix(KafkaDF)

次に、適切な列と行の配置でcsvにエクスポートできるように、別の変換を行います。

KDF2 <- apply(KafkaDFM, 2, as.character)
write.csv(KDF2,"C:\\Data\\KafkaCompleteClean.csv", row.names = TRUE)

4

0 に答える 0