2

私はRに比較的慣れていないので、実際にいくつかのデータを分析するためにRを使用しようとするのは初めてです。問題は次のとおりです。特定のシステムで処理されたリクエスト数のログを次の形式で含むCSVファイルがあります。

# Unix timestamp, number of requests
1354810257,241624
1354810258,244759
1354810259,245307
1354810260,248961

現時点では、ファイルには1週間の期間に関連する情報が含まれています。次に、システムが維持できる1秒あたり、1時間あたり、および1日あたりのリクエスト数を示すグラフを取得する必要があります。

4

1 に答える 1

1

Pythonとmatplotlibを使用して解決しました。コードは次のようなものです。

import csv
from pylab import *
from itertools import groupby

def by_hour(value):
    return value[0] // 3600

def plot_data_for(data, map_, reduce_):
    keys = []
    values = []
    for k,v in groupby(data, key=map_):
        keys.append(k)
        values.append(reduce_(v))
    return (keys, values)

times = []
requests = []
reader = csv.reader(open("results.csv"))

for row in reader:
    times.append(int(row[0]))
    requests.append(int(row[1]))

increments = map(lambda x: x[1] - x[0], zip(requests, requests[1:] + [requests[-1]]))
plot(*plot_data_for(zip(times, increments), by_hour, lambda values: sum(map(lambda x: x[1], values))))
于 2013-01-11T14:43:55.353 に答える