2015年7月3日金曜日

R:複数列のユニークデータを抽出する(重複除去)

【目的】 複数列のユニークデータを抽出する(重複データを除去)
【方法】 distinct(df, x)
【補足】 library(dplyr)が必要

#テスト用データフレームを作成

v.x <- c(1,2,3,4)
v.x1 <- c("x","a","a","a")
v.x2 <- c("11","11","11","11")
df.x <- data.frame(id = v.x, name = v.x1, num = v.x2)

df.x

> df.x
  id name num
1  1    x  11
2  2    a  11
3  3    a  11
4  4    a  11

distinct(df.x, name)

> distinct(df.x, name)
  id name num
1  1    x  11
2  2    a  11


R ユニーク数をカウントする
http://mototeds.blogspot.jp/2015/06/r_29.html

0 件のコメント :

コメントを投稿