Google クラウドの Python ドキュメントには、次の機能を持つスクリプト (python-docs-samples/dataproc/submit_job_to_cluster.py) があります。
def create_cluster(dataproc, project, zone, region, cluster_name):
print('Creating cluster...')
zone_uri = 'https://www.googleapis.com/compute/v1/projects/{}/zones/{}'.format(
project, zone)
cluster_data = {
'projectId': project,
'clusterName': cluster_name,
'config': {
'gceClusterConfig': {
'zoneUri': zone_uri
}
}
}
result = dataproc.projects().regions().clusters().create(
projectId=project,
region=region,
body=cluster_data).execute()
return result
この関数でクラスターのマスター ノードとワーカー ノードのマシン タイプを指定できるかどうか疑問に思っていました。