データ分析備忘録 in Tokyo: R　高速に大規模データのクロス集計をおこなう（tally, spread）

2016年8月23日火曜日

R　高速に大規模データのクロス集計をおこなう（tally, spread）

【目的】　Rで高速に大規模データのクロス集計をしたい
【方法】　tallyとspredを使う
【補足】　library(dplyr)とlibrary(tidyr)が必要

df.cross <- df.data %>%
group_by(x, y) %>%
tally %>%
spread(y, n)

#データが無い場合はNAとなるため必要に応じて0にする
df.cross[is.na(df.cross)] <- 0

◇参照URL
クロス集計～公式：dplyr + tidyr = (xtabs|(f)table)
http://d.hatena.ne.jp/teramonagi/20150312/1426109245

0 件のコメント :

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

データ分析備忘録 in Tokyo

注目の投稿

【kepler.gl】コロナ対策による人流の変化も地図上に可視化（各種メディアで報道）

2016年8月23日火曜日

R　高速に大規模データのクロス集計をおこなう（tally, spread）

0 件のコメント :

コメントを投稿

人気の投稿

ラベル

注目の投稿

【kepler.gl】コロナ対策による人流の変化も地図上に可視化（各種メディアで報道）

2016年8月23日火曜日

R 高速に大規模データのクロス集計をおこなう（tally, spread）

0 件のコメント :

コメントを投稿

R　高速に大規模データのクロス集計をおこなう（tally, spread）