ある列に存在する値、つまり別の列の StringType 、つまり ArrayType を検索する必要があるデータフレームがありますが、最初の列の最初の出現から配列の最後の値まで 2 番目の列から値を選択したいと考えています。
以下に例を挙げて説明します。
入力 DF は次のとおりです。
Employee_Name|Employee_ID|Mapped_Project_ID
Name1|E101|[E101, E102, E103]
Name2|E102|[E101, E102, E103]
Name3|E103|[E101, E102, E103, E104, E105]
出力 DF は次のようになります。
Employee_Name|Employee_ID|Mapped_Project_ID
Name1|E101|[E101, E102, E103]
Name2|E102|[E102, E103]
Name3|E103|[E103, E104, E105]