以下に示すように、2つのデータフレームがあります。
import databricks.koalas as ks
input_data = ks.DataFrame({'code':['123a', '345b', '678c'],
'id':[1, 2, 3]})
my_data = ks.DataFrame({'code':['123a', '12a', '678c'],
'id':[7, 8, 9], 'stype':['A', 'E', '5']})
これらの2つのデータフレームには、という列があり、存在する列の値と存在するcode
列の値を確認し、結果のデータフレームに保存したいと思います。データフレームには、input_data に存在する列値のみが含まれます。各データフレームの列数は異なる場合があり、ここでサンプルを示しましたcode
my_data
input_data
output
output
code
データフレームは、このoutput
質問で提供されたサンプルに基づいて、次のような結果になります。
display(output)
# Result is below
Code id
'123a' 7
主に for ループを使用するソリューションをオンラインで見つけましたが、これにアプローチするより効率的な方法があるかどうか疑問に思っていました。
皆さん、ありがとうございました!