8時くらいの防衛省周辺の様子。いつもは左の方に見えるスカイツリーも雪で見えない。
データ分析に関する備忘録。主にR言語を使ったデータの前処理や統計、機械学習などの方法を記録。ビッククエリとトレジャーデータがお気に入り。オフラインとオンラインの連携が最近のマイブーム。
注目の投稿
【kepler.gl】コロナ対策による人流の変化も地図上に可視化(各種メディアで報道)
kepler.glのサイト画面 kepler.glを使ってコロナ対策の効果を分析したところ、テレビ、新聞、ネットのメディアから問い合わせや報道依頼が殺到。今も、土日返上で都内や全国の人流変化を分析しています。この記事では人流変化の可視化に便利なkepler.glにつ...
2016年11月24日木曜日
2016年11月16日水曜日
【トレジャーデータ】データベース名が数字の場合(sql:presto)
データベース名の先頭が数字の場合通常ならエラーとなるが、""でDB名を囲むことでエラー回避できる。
例
FROM
"1_db". tb
例
FROM
"1_db". tb
ラベル:
presto
,
SQL
,
Treasure Data
,
トレジャーデータ
2016年11月8日火曜日
【R】data.tableとdplyrの内容が良くまとまっているページ
Rで大規模データの処理をするには、data.tableとdplyrが必須です。
下記のページは、その内容が簡潔にまとめられていて非常に参考になります。
大規模データの高速処理 ーdata.table、dplyrー
http://kohske.github.io/ESTRELA/201410/index.html
特に、他のサイトではあまり紹介されていないキーの設定の説明があるところ良いです。
setkey(dt, key)
d: データテーブル
key: キーとなるカラム名
これだけでデータ集計が高速に!
下記のページは、その内容が簡潔にまとめられていて非常に参考になります。
大規模データの高速処理 ーdata.table、dplyrー
http://kohske.github.io/ESTRELA/201410/index.html
特に、他のサイトではあまり紹介されていないキーの設定の説明があるところ良いです。
setkey(dt, key)
d: データテーブル
key: キーとなるカラム名
これだけでデータ集計が高速に!
ラベル:
data.table
,
dplyr
,
R
,
データ処理
,
大規模データ
登録:
投稿
(
Atom
)