問題タブ [n-triples]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
46 参照

sparql - SPARQL: オブジェクトの特定のタイプが複数あるサブジェクトを返す

前もって感謝します。一部の作業をマージすると、トリプルストアで 1 つのサブジェクトに対して 2 つの GUID が生成されるという問題があります。これらの GUID を正規化できるように、これらのインスタンスをすべて分離する方法が必要です。私はSPARQLが初めてです。これらを COUNT と FILTER で返そうとしましたが、今のところ失敗しています。これが私たちが見ているものです。

申し訳ありませんが、折り返されたテキストにより読みにくくなっています。ただし、2 つの GUID を持つ件名http://example.com/#barがあることがわかります。同じグラフにこのような多くのケースがあり、それらをすべて識別する方法が必要です。再度、感謝します。

0 投票する
1 に答える
177 参照

arrays - インデックスを使用して JSON オブジェクトを非平坦化する / n トリプルを階層型 Excel に逆シリアル化する

ツール Screaming Frog から JSON+LD (構造化) データを解析しました。Excel では親子関係 (相互参照) が 1 つの行にないため、このツールがデータをエクスポートする形式は機能しません。編集: このシリアル化された形式は、n トリプルと呼ばれます。以下は、インデックスの関係を色分けした出力例です (申し訳ありませんが、まだ画像を投稿することは許可されていません)。

https://imgur.com/Ofx1jyW

以下は、ネストされたすべてのレベルが独自の列にある場合に必要な最終出力の例です。ネストされた各レベル (最大 4 つの深さ) は、親パス情報を繰り返して、独自の列にマップする必要があります。

既存のフラット化されていないソリューションを探しましたが、これらは単一の列に格納されたパス情報を使用するか (各「最低レベル値」には独自の「行」があります)、インデックスに基づいて元のデータを再構築しません。

for ループと SQL JOINS を組み合わせてこれを実行しようとしていますが、もっと洗練された解決策が必要だと感じています。これは、Python、PHP、JS、SQL、またはそれらの組み合わせである可能性があります。または、各「サブジェクト」を MongoDB ドキュメントに追加してから、これにマージ操作を適用することもできますか?

編集: この記事の SEO を最適化するためにタイトルを更新します。私が扱っているこの RDF および JSON+LD データのシリアル化された形式は、N トリプルと呼ばれます。詳細はこちら: https://medium.com/wallscope/understanding-linked-data-formats-rdf-xml-vs-turtle-vs-n-triples-eb931dbe9827

0 投票する
0 に答える
138 参照

rdf - RDFナレッジグラフの無効な文字およびその他の問題

以下のような N-Triples および Turtle 形式の中規模および大規模なナレッジ グラフの古いバージョンを処理してきました。

それらはすべて、不正な形式のトリプルを含んでいるようです。で処理中のエラーの例serdi -l:

ウィキデータ 2015

フリーベース 2012

LinkedBrainz 2017

より多くの例があります。主な質問が 2 つあります。

  1. これらのファイルがそのようなエラーで生成された理由および/または方法についての説明はありますか? これらのファイルは、トリプル ストアまたは Apache Jena などのエンジンをダンプすることによって生成されたものであり、適切な形式であると予想されます。代わりに、ある種のカスタム スクリプト (または Unix ツールのパイプラインか?) を使用してそれらがまとめられた可能性が高いように思われるため、エラーが発生します...
  2. これらのファイルを修正する方法はありますか? (または、最悪のシナリオでは、. 以外の不正な行を無視しserdi -lます。クリーニング スクリプトを最初から実装する必要がないソリューションの追加ポイント)。