問題タブ [u-sql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - Azure Data Lake Analytics: U-SQL を使用して重複する期間を組み合わせる
U-SQL を使用して、Azure Data Lake Store に配置された CSV データから重複する期間を削除し、それらの行を結合したいと考えています。データ セットには、開始時刻と終了時刻が含まれており、レコードごとに他のいくつかの属性が含まれています。以下に例を示します。
オーバーラップを削除すると、出力データ セットは次のようになります。
CSV には膨大な量のデータが含まれており、数 GB のサイズで構成されていることに注意してください。私はこの問題を解決しようとしていますが、うまくいきません。Azure Data Lake Analytics ジョブの U-SQL ユーザー定義演算子を避け、U-SQL 内から効率的なソリューションを探しています。
cortana-intelligence - U-SQL: スキーマ化された入力ファイル
U-SQL スクリプトでスキーマ化された入力ファイルを使用するにはどうすればよいですか? つまり、複数のファイルを EXTRACT 句への入力として使用するにはどうすればよいでしょうか?
によると
https://msdn.microsoft.com/en-us/library/azure/mt621320.aspx?f=255&MSPPError=-2147217396
と
両方試してみました
と
どちらのバージョンでも、「*」が無効な文字であるというエラー メッセージが表示されます。
azure-data-lake - Usql - 内部システム エラーによりジョブが失敗しました - NM_CANNOT_LAUNCH_JM
次のシステム エラーが発生します。
アクティビティのエラー: [{"errorId":"E_SYSTEM_NM_NMCANNOTLAUNCHJM" ,"name":"NM_CANNOT_LAUNCH_JM" ,"severity":"Error" ,"source":"System" ,"component":"NM" ,"message": 「内部システム エラーのため、ジョブが失敗しました。」,"詳細":"" ,"説明":"","解像度":"","helpLink":"","innerError":null}].
エラーは断続的ではありません。ある場所から別の場所にファイルをコピーするだけです。内部システムエラーと表示されます - 何かアイデアはありますか?
以下は私のUsqlスクリプトです。
diacritics - USQL 急性アクセント
U-SQL は初めてです。いくつかの基本的なクエリを実行しようとしていますが、鋭いアクセントの処理方法に問題があることがわかりました。
データに鋭いアクセントがある場合、エラーが発生して続行できません。私はスペイン人なので、扱っているデータのほとんどに鋭いアクセントがあります。
何か案が?特別なコーディング プロトコルに従う必要がありますか?
azure-data-lake - BCP CSV ファイルからの U-SQL 抽出エラー
BCP を使用して SQL Server から抽出したデータがあります。ファイルは ASCII CSV です。
2016-03-03T23:00:00 形式の日付。
抽出を実行すると、取得します
追加情報:
{"diagnosticCode":195887127,"severity":"Error","component":"RUNTIME","source":"User","errorId":"E_RUNTIME_USER_EXTRACT_COLUMN_CONVERSION_INVALID_ERROR","message":"変換しようとすると無効な文字ですcolumn data.","description":"HEX: \"223022\" 入力レコードの変換時に無効な文字です。\n位置: 1 行目、21 列目。","解決":"入力にエラーがないか確認するか、\"silent を使用してください\" 入力内のオーバー (アンダー) サイズの行を無視するように切り替えます。\n\"無効な\" 行を無視するとジョブの結果に影響を与える可能性があり、変換エラーを無視するには型が null 可能である必要があることを考慮してください。","helpLink": ""、"詳細":"================================================== ==========================================\nHEX:5432333B35313B34362D323031362E30332E30335432333B30303B30302D302D352D323031362E30332E30335432333B35313B34392F3536372D302D323031362E30332E3033\n ^\ nTEXT:T23:51:46,2016-03-03T23:00:00,0,5,2016-03-03T23:51:49.567,0,2016-03-03\n
抽出時に日付を適切に処理するにはどうすればよいですか? 日時列の途中で分割されている理由は不明です。
サンプル行は次のようになります
50CA2FBB-95C3-4216-A729-999BE2DB491A,2016-03-03T23:51:49.567,1001464881,1001464795,1001464795,00000000-0000-0000-0000-000000000000,00000000-0000-0000-0000-000000000000,100 ,100 , ,12643,bCAwvRnNVwrKDXKxZkVed2Z1zHY=,o2lsnhueDApmvSbm31mh3aetYnc=,2016-03-03T23:50:46,2016-03-03T23:00:00,2016-03-03T23:51:46,2016-03-03T20,: ,5,2016-03-03T23:51:49.567,0,2016-03-03T00:00:00,2016-03-03T23:59:59,00000000-0000-0000-0000-000000000000