Apache Drill に関する私の現在のクエリは次のとおりです -
select
CAST(columns[0] AS Integer) as ID,
to_timestamp(SUBSTR(columns[10],1,14),'YYYYMMddHHmmss') as RecordDt
from dfs.`/data/100Krows/`
私がやりたいことは、フォルダー内の各.csvファイルのmodificationTimeメタデータを次のような列として取得することです-
select
CAST(columns[0] AS Integer) as ID,
to_timestamp(SUBSTR(columns[10],1,14),'YYYYMMddHHmmss') as RecordDt,
modificationTime as versionStartTime
from dfs.`/data/100Krows/`
次のコマンドを実行すると、modificationTime メタデータが見つかります。
SHOW FILES in dfs.data
現在のバージョン 1.1 または 1.0 でこれを実現する方法はありますか?
更新 1
私が本当に探しているのは、個々のファイルに対する select ステートメントの結果セットに含まれるファイル メタデータです。
ディレクトリ構造が次の場合-
dir0
dir1
samefilename.csv -- Modified Date - 10/01/2013
*******DATA******
Col0,Col1,Col2
Val1-2013,Val2-2013,Val3-2014
*******DATA******
dir2
samefilename.csv -- Modified Date - 10/01/2014
*******DATA******
Col0,Col1,Col2
Val1-2014,Val2-2014,Val3-2014
*******DATA******
書きたいクエリの種類 -
select
name as filename,
modificationTime as versionStartTime,
Col0,
Col2,
Col3
from dfs.`/dir0/`
期待される結果 -
Columns[0] Columns[1] Columns[2] .....
samefileName.csv 10/01/2013 Val1-2013 .....
samefileName.csv 10/01/2014 Val1-2014 .....