1

私は大規模なデータ ファイルの世界に不慣れで、自分のデータの形式がどうなるか疑問に思っています。データは、匿名化された医療記録を含む非常に大きなテキスト ファイルです。以下にサンプルを貼り付けました。

同様の行に関連するコードのように見える4番目の列を除いて、各列が何であるかを理解しています。このタイプのデータはリレーショナル データベースから取得されますか? もしそうなら、この種のフォーマットの名前はありますか?

どんな助けでも大歓迎です。

649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1169|Blood Pressure (Diastolic)|80
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1170|Blood Pressure (Systolic)|140
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1174|Vital Signs Delta|0
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1175|Pulse|64
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1176|Respiratory Rate|14
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1178|Weight|73.7
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1180|Weight Units|Kilograms
649|183|Vital Signs|ACEFCC5F-C6FA-426F-AC26-7A23D7E6B26E|1169|Blood Pressure (Diastolic)|
649|183|Vital Signs|ACEFCC5F-C6FA-426F-AC26-7A23D7E6B26E|1170|Blood Pressure (Systolic)|
4

1 に答える 1

1

区切り文字として使用する通常の区切りスタイルのテキスト ファイルのように見えます|

これは特定の標準ではありませんが、多くの異なるプログラムがそのようなファイルを生成および使用できます。どの特定のソフトウェアがこれを生成したかを特定することはできません。

プラットフォームと言語によっては、このファイルをかなり簡単に解析できます。1 行に 1 つのレコードがあり、各フィールドは|.

4 番目の列はGUIDです。GUID は多くのアプリケーションで非常に一般的であり、非常に大規模なデータベースや切断されたデータベースのシナリオで識別子として何度も使用されます (その性質上、重複が作成される可能性は非常に低いため)。

于 2012-09-28T19:12:05.983 に答える