問題タブ [azure-databricks]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - 単純な SQL 結合に相当する PySpark
これはおそらく単純な質問ではありません。
しかし、私は自分自身ではあまり進んでいません。
Databricks で PySpark を使用して、ルックアップに相当する SQL を実行しようとしています。
の両側にある 2 つの属性on
は同じ名前ではないことに注意してください。
同じのpysparkバージョンを見せてもらえますか? これについてここにある多数の接線の投稿は、これよりも複雑すぎるようです。
私はこれを見つけましたが、これは本当に近いですが、返されたデータフレームはすべてtaとtbの列です。
inner_join = ta.join(tb, ta.name == tb.name)
azure - Azure Databricks の R バージョン
Azure Databricks は現在 R バージョン 3.4.4 (2018-03-15) を実行していますが、CRAN の最新の R バージョンは 3.5.2 (2018-12-20) であるため、これは私の意見では受け入れられません。
私の質問は、R バージョン 3.5.2 を Azure Databricks にアップグレードしてインストールすることは可能ですか? フォローアップの質問です。R on Databricks のリリース スケジュールに関する情報はありますか?