0

以下に示すように、2つのデータフレームがあります。

import databricks.koalas as ks

input_data = ks.DataFrame({'code':['123a', '345b', '678c'],
        'id':[1, 2, 3]})

my_data = ks.DataFrame({'code':['123a', '12a', '678c'],
        'id':[7, 8, 9], 'stype':['A', 'E', '5']})

これらの2つのデータフレームには、という列があり、存在する列の値と存在するcode列の値を確認し、結果のデータフレームに保存したいと思います。データフレームには、input_data に存在する列値のみが含まれます。各データフレームの列数は異なる場合があり、ここでサンプルを示しましたcodemy_datainput_dataoutputoutputcode

データフレームは、このoutput質問で提供されたサンプルに基づいて、次のような結果になります。

display(output)

# Result is below
 Code    id 
'123a'   7

主に for ループを使用するソリューションをオンラインで見つけましたが、これにアプローチするより効率的な方法があるかどうか疑問に思っていました。

皆さん、ありがとうございました!

4

1 に答える 1