大規模なデータセットをより小さく、視覚化しやすいデータセットに縮小するための統計的方法がいくつかあります。あなたの質問からは、どの要約統計量が必要かは明確ではありません。為替レートが時間の関数としてどのように変化するかを見たいと思っていると仮定しましたが、為替レートが特定の値を超える頻度や、私が考慮していない他の統計に興味があるかもしれません。
時間の経過に伴う傾向の要約
Rでlowessメソッドを使用した例を次に示します (散布図の平滑化に関するドキュメントから)。
> library(graphics)
# print out the first 10 rows of the cars dataset
> cars[1:10,]
speed dist
1 4 2
2 4 10
3 7 4
4 7 22
5 8 16
6 9 10
7 10 18
8 10 26
9 10 34
10 11 17
# plot the original data
> plot(cars, main = "lowess(cars)")
# fit a loess-smoothed line to the points
> lines(lowess(cars), col = 2)
# plot a finger-grained loess-smoothed line to the points
> lines(lowess(cars, f=.2), col = 3)
パラメーター f は、回帰がデータにどの程度適合するかを制御します。過適合せずにデータに正確に適合するものが必要なため、これにはある程度の注意を払ってください。速度と距離ではなく、為替レートと時間をプロットできます。
平滑化の結果にアクセスするのも簡単です。その方法は次のとおりです。
> data = lowess( cars$speed, cars$dist )
> data
$x
[1] 4 4 7 7 8 9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 16 16 17 17 17 18 18 18 18 19 19
[38] 19 20 20 20 20 20 22 23 24 24 24 24 25
$y
[1] 4.965459 4.965459 13.124495 13.124495 15.858633 18.579691 21.280313 21.280313 21.280313 24.129277 24.129277
[12] 27.119549 27.119549 27.119549 27.119549 30.027276 30.027276 30.027276 30.027276 32.962506 32.962506 32.962506
[23] 32.962506 36.757728 36.757728 36.757728 40.435075 40.435075 43.463492 43.463492 43.463492 46.885479 46.885479
[34] 46.885479 46.885479 50.793152 50.793152 50.793152 56.491224 56.491224 56.491224 56.491224 56.491224 67.585824
[45] 73.079695 78.643164 78.643164 78.643164 78.643164 84.328698
返されるデータ オブジェクトには x および y という名前のエントリが含まれており、これらは lowess 関数に渡された x および y の値に対応しています。この場合、x と y は速度と距離を表します。