単一のオブジェクトと約 100 行を含む json 行の形式のサンプル抽出があります。1行あたり約800項目あります。
データのサンプルを次に示します。
Row 1 - {"Id":"User1","OwnerId":"OwnerID1","IsDeleted":false,"Name":"SampleName1", etc...}
Row 2 - {"Id":"User2","OwnerId":"OwnerID2","IsDeleted":true,"Name":"SampleName2", etc...}
これを次のようなデータフレームに変換したい:
Id | OwnerId | IsDeleted | Name | etc..
User1 | OwnerID1 | false | SampleName1 | etc..
User2 | OwnerID2 | true | SampleName2 | etc..
dplyr と tidyr を試してみましたが、うまくいきませんでした。
これを処理する最適な方法は何ですか?
これを解決するには、まず JSON バリデーターを使用してデータを解析し、データのフォーマットを修正しました。データを「適切な」JSON 形式に変換したら、R でデータ フレームとして使用するのは非常に簡単でした。
他のユーザーから提案されたjsonLiteを使用しましたが、すべてうまくいきました。
install.packages("jsonlite")
library(jsonlite)
KafkaDF <- fromJSON("Kafka_Formatted_Full.JSON")
データ構造のため、マトリックスへの変換が必要でした。
KafkaDFM = as.matrix(KafkaDF)
次に、適切な列と行の配置でcsvにエクスポートできるように、別の変換を行います。
KDF2 <- apply(KafkaDFM, 2, as.character)
write.csv(KDF2,"C:\\Data\\KafkaCompleteClean.csv", row.names = TRUE)