DataBricks と Apache Spark は初めてです。ノートブックに Python を使用したいと考えています。
私はデータ ブリックを使用しており、作成したことを確認できます。
- 接続された python ベースのノートブック (test-notebook) と共にクラスター (test)
- JSON ファイルからのテーブル (employee_info)
- ノート。
私が持っているサンプル テーブルは、テスト ファイルとしてアップロードした JSON からのもので、以下のとおりです。
{
"FirstName": "John",
"LastName": "Mark",
"MiddleName": "Lewis",
"username": "johnlewis2",
"Id ": "29103-1201-E",
"YearJoined": "2014",
"MonthJoined": "7",
"DayJoined": "23",
"TimeJoined": "14:32",
"Manager": "Larry Hins",
"Position": "Web Developer",
"Building": "Blue Building",
"Floor": "2"
}
このテーブルをアップロードした場合、どうすればよいですか (ノートブックに Python を使用していると仮定します):
- テーブルにアクセスする
- 行全体を複製する
- 重複した列を含むテーブルを新しいテーブルとして保存します
ありがとう。