0

DataBricks と Apache Spark は初めてです。ノートブックに Python を使用したいと考えています。

私はデータ ブリックを使用しており、作成したことを確認できます。

  • 接続された python ベースのノートブック (test-notebook) と共にクラスター (test)
  • JSON ファイルからのテーブル (employee_info)
  • ノート。

私が持っているサンプル テーブルは、テスト ファイルとしてアップロードした JSON からのもので、以下のとおりです。

{ 
 "FirstName": "John",
 "LastName": "Mark",
 "MiddleName": "Lewis",
 "username": "johnlewis2",
 "Id ": "29103-1201-E",
 "YearJoined": "2014",
 "MonthJoined": "7",
 "DayJoined": "23",
 "TimeJoined": "14:32",
 "Manager": "Larry Hins",
 "Position": "Web Developer",
 "Building": "Blue Building",
 "Floor": "2"
 }

このテーブルをアップロードした場合、どうすればよいですか (ノートブックに Python を使用していると仮定します):

  • テーブルにアクセスする
  • 行全体を複製する
  • 重複した列を含むテーブルを新しいテーブルとして保存します

ありがとう。

4

0 に答える 0