1

ツール Screaming Frog から JSON+LD (構造化) データを解析しました。Excel では親子関係 (相互参照) が 1 つの行にないため、このツールがデータをエクスポートする形式は機能しません。編集: このシリアル化された形式は、n トリプルと呼ばれます。以下は、インデックスの関係を色分けした出力例です (申し訳ありませんが、まだ画像を投稿することは許可されていません)。

https://imgur.com/Ofx1jyW

Subject     Predicate                           Object
subject27   schema.org/aggregateRating          subject28
subject27   schema.org/offers                   subject29
subject27   schema.org/operatingSystem          ANDROID
subject27   type                                schema.org/SoftwareApplication
subject28   schema.org/ratingCount              15559
subject28   schema.org/ratingValue              3.597853422
subject28   type                                schema.org/AggregateRating
subject29   schema.org/price                    0
subject29   type                                schema.org/Offer

以下は、ネストされたすべてのレベルが独自の列にある場合に必要な最終出力の例です。ネストされた各レベル (最大 4 つの深さ) は、親パス情報を繰り返して、独自の列にマップする必要があります。

Predicate L1                Object L1                       Predicate L2            Object L2
type                        schema.org/SoftwareApplication      
schema.org/operatingSystem  ANDROID     
schema.org/aggregateRating  subject28                       schema.org/ratingCount  15559
schema.org/aggregateRating  subject28                       schema.org/ratingValue  3.597853422
schema.org/aggregateRating  subject28                       type                    schema.org/AggregateRating
schema.org/offers           subject29                       schema.org/price        0
schema.org/offers           subject29                       type                    schema.org/Offer

既存のフラット化されていないソリューションを探しましたが、これらは単一の列に格納されたパス情報を使用するか (各「最低レベル値」には独自の「行」があります)、インデックスに基づいて元のデータを再構築しません。

for ループと SQL JOINS を組み合わせてこれを実行しようとしていますが、もっと洗練された解決策が必要だと感じています。これは、Python、PHP、JS、SQL、またはそれらの組み合わせである可能性があります。または、各「サブジェクト」を MongoDB ドキュメントに追加してから、これにマージ操作を適用することもできますか?

編集: この記事の SEO を最適化するためにタイトルを更新します。私が扱っているこの RDF および JSON+LD データのシリアル化された形式は、N トリプルと呼ばれます。詳細はこちら: https://medium.com/wallscope/understanding-linked-data-formats-rdf-xml-vs-turtle-vs-n-triples-eb931dbe9827

4

1 に答える 1