私は、RDBMS システムやその他のデータベース システムよりも前に、R のテーブルとデータ構造の世界に触れていました。R/Python では、構造化されたデータ (.csv またはその他の形式) からテーブルとリストを作成し、プログラムでデータ操作を行うのは非常に洗練されています。
昨年、私はデータベース管理のコースに参加し、構造化データベースと非構造化データベースについてすべて学びました。また、R でデータを直接使用するのではなく、複数のデータ ソースからデータベースにデータをフィードするのが標準であることにも気付きました (利便性と規律のため?)。
研究目的では、結合、追加、さらには複雑なデータ操作には R で十分なようです。
read.csv などのコマンドを使用して R を直接使用する場合、データベースを作成し、R-SQL インターフェイスを使用してテーブルからクエリを実行することにより、R を使用する場合はいつですか?
たとえば、(a) 個人レベルの情報 (年齢、性別、喫煙習慣)、(b) 結果変数 (彼らがリアルタイムで行った調査など)、(c) 共変量情報などのマルチソース データがあるとします。 (環境特性)、(d) 治療入力 (結果を変更するイベントの発生 - 調査の回答) (d) 調査参加者の時間と空間の情報
この場合のデータ収集と処理へのアプローチ方法。標準的な業界の手順があるかもしれませんが、個人や研究者の小さなグループが採用できる実行可能で最適なアプローチのリストを理解するために、ここでこの質問を提案します.