Rの弱み:大規模データの処理
→ data.tableパッケージを活用することで大規模データも高速に処理可能
> library(data.table)
>
> #Rで大規模csvファイルを読み込む
>
> #read.csvで読み込む場合
> system.time(df.read.csv <- read.csv(file("C:/R_test/data/test.csv")))
ユーザ システム 経過
50.34 0.18 50.56
>
> #data.tableパッケージのfreadで読み込む場合
> system.time(df.fread <- fread("C:/R_test/data/test.csv"))
ユーザ システム 経過
1.92 0.02 1.94
経過時間 | |
read.csv | 50.56 |
fread | 1.94 |
freadの方が26倍以上早い!
0 件のコメント :
コメントを投稿
注: コメントを投稿できるのは、このブログのメンバーだけです。