ツール Screaming Frog から JSON+LD (構造化) データを解析しました。Excel では親子関係 (相互参照) が 1 つの行にないため、このツールがデータをエクスポートする形式は機能しません。編集: このシリアル化された形式は、n トリプルと呼ばれます。以下は、インデックスの関係を色分けした出力例です (申し訳ありませんが、まだ画像を投稿することは許可されていません)。
Subject Predicate Object
subject27 schema.org/aggregateRating subject28
subject27 schema.org/offers subject29
subject27 schema.org/operatingSystem ANDROID
subject27 type schema.org/SoftwareApplication
subject28 schema.org/ratingCount 15559
subject28 schema.org/ratingValue 3.597853422
subject28 type schema.org/AggregateRating
subject29 schema.org/price 0
subject29 type schema.org/Offer
以下は、ネストされたすべてのレベルが独自の列にある場合に必要な最終出力の例です。ネストされた各レベル (最大 4 つの深さ) は、親パス情報を繰り返して、独自の列にマップする必要があります。
Predicate L1 Object L1 Predicate L2 Object L2
type schema.org/SoftwareApplication
schema.org/operatingSystem ANDROID
schema.org/aggregateRating subject28 schema.org/ratingCount 15559
schema.org/aggregateRating subject28 schema.org/ratingValue 3.597853422
schema.org/aggregateRating subject28 type schema.org/AggregateRating
schema.org/offers subject29 schema.org/price 0
schema.org/offers subject29 type schema.org/Offer
既存のフラット化されていないソリューションを探しましたが、これらは単一の列に格納されたパス情報を使用するか (各「最低レベル値」には独自の「行」があります)、インデックスに基づいて元のデータを再構築しません。
for ループと SQL JOINS を組み合わせてこれを実行しようとしていますが、もっと洗練された解決策が必要だと感じています。これは、Python、PHP、JS、SQL、またはそれらの組み合わせである可能性があります。または、各「サブジェクト」を MongoDB ドキュメントに追加してから、これにマージ操作を適用することもできますか?
編集: この記事の SEO を最適化するためにタイトルを更新します。私が扱っているこの RDF および JSON+LD データのシリアル化された形式は、N トリプルと呼ばれます。詳細はこちら: https://medium.com/wallscope/understanding-linked-data-formats-rdf-xml-vs-turtle-vs-n-triples-eb931dbe9827