R で実質的な組織全体のコード ベースを構築している場合、データ変更タスクの既定のアプローチとして sqldf パッケージに依存することは許容されるでしょうか? それとも、可能であれば R 固有の構文を使用した操作に依存するのがベスト プラクティスですか? sqldf に依存することにより、かなりの量の異なる構文 SQL が R コード ベースに導入されます。
保守性とスタイルに特に関連して、この質問をしています。既存の R スタイル ガイドを検索しましたが、このテーマに関するものは見つかりませんでした。
編集: 私が関心のあるワークフローを明確にするために、次のように sqldf を十分に使用するデータ変更スクリプトを検討してください。
library(sqldf)
gclust_group<-sqldf("SELECT clust,SUM(trips) AS trips2
FROM gclust
GROUP BY clust")
gclust_group2<-sqldf("SELECT g.*, h.Longitude,h.Latitude,h.withinss, s.trips2
FROM highestd g
LEFT JOIN centers h
ON g.clust=h.clust
LEFT JOIN gclust_group s
ON g.clust=s.clust")
そして、そのようなスクリプトは何行も続く可能性があります。(Hadoop と PIG に精通している方にとっては、このスタイルは実際には PIG スクリプトに似ています)。複雑なサブクエリを回避できるという利点がありますが、ほとんどの作業は SQL 構文を使用して行われます。