データ分析備忘録 in Tokyo: R：複数列のユニーク数をカウントする（重複除去してカウント）

2015年6月29日月曜日

R：複数列のユニーク数をカウントする（重複除去してカウント）

【目的】　ユニーク数を数える（重複を除去して数える）
【方法】　n_distinct(v.x)
【補足】　library(dplyr)が必要

#テスト用データフレームを作成

v.x <- c(1,2,3,4)
v.x1 <- c("x","a","a","a")
v.x2 <- c("11","11","11","11")
df.x <- data.frame(id = v.x, name = v.x1, num = v.x2)

df.x

> df.x
  id name num
1  1    x  11
2  2    a  11
3  3    a  11
4  4    a  11
>

df.x %>%
summarize(id_u = n_distinct(id),name_u = n_distinct(name),num_u = n_distinct(num))

> df.x %>%
+   summarize(id_u = n_distinct(id),name_u = n_distinct(name),num_u = n_distinct(num))
  id_u name_u num_u
1    4      2     1

R ユニークデータを抽出する
http://mototeds.blogspot.jp/2015/07/r.html

0 件のコメント :

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。

データ分析備忘録 in Tokyo

注目の投稿

【kepler.gl】コロナ対策による人流の変化も地図上に可視化（各種メディアで報道）

2015年6月29日月曜日

R：複数列のユニーク数をカウントする（重複除去してカウント）

0 件のコメント :

コメントを投稿

人気の投稿

ラベル