以下の Python スクリプトを使用して を作成するdatasource
と、少なくとも 1 つの属性に 100% 欠損値があります。AWS ML ダッシュボードを介して手動で作成しdatasource
、同じ属性タイプを適用すると、欠落している値はありません。s3 からデータソースを作成する方法に問題はありますか?
file_names = [file_name_train, file_name_testing]
client = boto3.client('machinelearning')
schema_file = open('../Selections/aws_schema.txt', 'r')
schema = schema_file.read()
for file_name in file_names:
response = client.create_data_source_from_s3(
DataSourceId=file_name+date,
DataSourceName=file_name+date,
DataSpec={
'DataLocationS3': 's3://'+bucket_name+'/'+file_name+file_extension,
'DataSchema': schema,
},
ComputeStatistics=True
)