私は自分の質問に対する答えを探してスタックを検索しました。これは私の質問に近づいていますが、グラフを修正するためにコードを変更することに失敗しました。
長い形式で再形成された、次のようなデータがあります。
ID Var1 GenePosition ContinuousOutcomeVar
1 control X20068492 0.092813611
2 control X20068492 0.001746708
3 case X20068492 0.069251157
4 case X20068492 0.003639304
それぞれID
にポジションごとに1つの値ContinuousOutcomeVar
があり、86のポジションと10のIDがあります。x軸に位置、y軸に連続結果変数を含む折れ線グラフをプロットしたいと思います。ケースグループとコントロールグループの2つのグループが必要なので、位置ごとに2つのドットが必要です。1つはケースの平均値で、もう1つはコントロールの平均値です。次に、ケースを接続する線と、コントロールを接続する線が必要です。これは簡単なことですが、私はRを初めて使用します。8時間作業を続けているので、正しく理解できません。以下は私が持っているものです。私は本当にいくつかの洞察に感謝します。これがスタックのどこかに存在する場合は、本当にお詫びします...正直に見て、たくさんのコードを変更しようとしましたが、それでも正しく理解できていません。
私のコード:このコードは、各位置にあるすべてのIDのすべての値をプロットし、2つのグループにそれらを接続します。それは私に位置ごとの10の値すべての平均で黒い点を与えます(私は思う):
lineplot <- ggplot(data=seq.long, aes(x=Position, y=PMethyl,
group=CACO, colour=CACO)) +
stat_summary (fun.y=mean, geom="point", aes(group=1), color="black") +
geom_line() + geom_point()
Rに10ポイントすべてをプロットしないようにすることはできません。位置ごとに2つの平均(ケース/コントロールグループごとに1つ)があり、ケースとコントロールの値はそれぞれx軸を横切る線で接続されています。