0

Apache Spark で次の PySpark コードを使用して ADLS ディレクトリにアクセスしようとすると、エラーが発生します。

ValueError: root_directory must be an absolute path. Got abfss://root@adlspretbiukadlsdev.dfs.core.windows.net/RAW/LANDING/ instead.
Traceback (most recent call last):

  File "/home/trusted-service-user/cluster-env/env/lib/python3.6/site-packages/great_expectations/core/usage_statistics/usage_statistics.py", line 262, in usage_statistics_wrapped_method
    result = func(*args, **kwargs)

ディレクトリにアクセスしようとしたときに上記のエラーが発生するコードは次のとおりです。

data_context_config = DataContextConfig(
                    datasources={"my_spark_datasource": my_spark_datasource_config},
                    store_backend_defaults=FilesystemStoreBackendDefaults(root_directory='abfss://root@adlspretbiukadlsdev.dfs.core.windows.net/RAW/LANDING/'),
                )

context = BaseDataContext(project_config=data_context_config)

コードを次のように変更すると

data_context_config = DataContextConfig(
                    datasources={"my_spark_datasource": my_spark_datasource_config},
                    store_backend_defaults=FilesystemStoreBackendDefaults(root_directory='/abfss://root@adlspretbiukadlsdev.dfs.core.windows.net/RAW/LANDING/'),
                )

次のエラー メッセージが表示されます。

PermissionError: [Errno 13] Permission denied: '/abfss:'
Traceback (most recent call last):

次のコードを入力すると

data_context_config = DataContextConfig(
                    datasources={"my_spark_datasource": my_spark_datasource_config},
                    store_backend_defaults=FilesystemStoreBackendDefaults(root_directory='/'),
                )

context = BaseDataContext(project_config=data_context_config)

エラーメッセージが表示されます:

PermissionError: [Errno 13] Permission denied: '/expectations'
Traceback (most recent call last):

ただし、「/expectations」というディレクトリはありません

補足として、Great_Expectations を実行しようとしています。

4

1 に答える 1