データベース フィールドに、構造化されていない一般的に汚れたデータがあります。データに一貫性のある共通の構造があります
すなわち:
field:
name:value
fieldset:
nombre <FieldSet>
field,
.
.
.
field(n)
table
nombre <table>
head(1)... head(n)
val(1)... val(n)
.
.
.
これらのデータ構造を抽出して学習/理解し、ファイルを解析し、検証チェックを実行できるマップまたはオブジェクトに変換できるツール (できれば Java) があるかどうか疑問に思っていました。
私は Antlr を認識していますが、これはツリー構造を対象としており、独立したデータ ビットではないことを理解しています (これは間違っていますか?)
全体として問題について何か提案はありますか?