次のようなクエリを使用して U-SQL で作業している Web ログ ファイルがあります。
@x =
EXTRACT Col1 string, UserAgent string, Col2 string
FROM "/file"
USING Extractors.Text(delimiter : ' ');
ただし、UserAgent には次のようなものが含まれている場合があります。
Android Tablet 10" blah blah
これは常に、スクリプトが行が 3 列ではなく 4 列であると見なすことを意味します。
誰もがこれに対処する方法について明るいアイデアを持っています..その文字をエスケープすることが可能かどうか、または抽出時に何らかの方法で無視することが可能かどうかはわかりませんか?