1

分析のために、高度に接続されたデータを SQL Server から Neo4j に一括インポートする必要があります。

これについて説明している Neo4j 開発者ガイドには 2 つのリンクがあります。

SQL Server インポートおよびエクスポート ウィザードによって生成された CSV ファイルからデータをインポートする最初の試みは、テーブルの列をノード属性にロードできませんでした。

上記のリンクにリストされているNeo4jの要件に準拠したCSVエクスポートを生成するようにSSISパッケージを構成するためのガイドを知っている人はいますか?

4

1 に答える 1

2

指し示すガイドはありませんが、この問題を自分で解決するための正しい方向を指し示すことができます。

  • インポート エクスポート ウィザードを使用しないでください。フラット ファイルの宛先を構成する機能が非常に制限され、パイプラインでデータを修正できなくなります。
  • ヘッダー行が必要なようです。つまり、データの最初の行がそれであることを確認する必要があります。たとえば、データがSQLからのものである場合、これはUNIONで行うことができます。すなわち

    SELECT 'Column1' as Column1
         , 'Column2' as Column2 
    UNION 
    SELECT <actual data from my table>
    
  • [最初のデータ行の列名] をオンにして、ヘッダー行を持つようにフラット ファイル接続マネージャーを構成します。

  • 派生列またはスクリプト タスクを使用して、テキスト内の特殊文字または引用符を引用符で囲むことができます。

     - "Special character in non-quoted text ← make sure unusual text is always quoted"
     - "stray quotes – standalone double or single quote in the middle 
    of non-quoted text, or non-escaped quotes in quoted text ← escape 
    or remove stray quotes"
    

リンクの提案に従って、CSVkit または Papa Parse を使用して、neo4j にアップロードする前に、最終的な CSV ファイルの問題を調べることができます。多くの場合、これらのデータ品質の問題はドメインに固有のものであり、いくつかの問題が解決されれば、それ以上のケアやフィードは必要ありません。

于 2015-02-10T13:46:17.820 に答える