2016年9月23日金曜日

【比較】Treasure Data と Big Query の違い

先日、TDの人とTDとBig Queryの違いについて話す機会があったのでまとめてみました。


Big QueryTreasure Data
機械学習不可可能(Hivemallを利用)
データ構造変更drop & create table が必要Schema less のためdrop table が不要
Jobスケジュール機能
ログ欠損率

参考:BigQueryのstreaming insertでログが欠損する http://qiita.com/shibacow/items/199a17f07c525d3dbb2d

Fluentdのchunk毎にID管理を行い重複制御を実装

クエリ安定性中程度高い
他システム連携

GCP製品TDユーザ間でのデータ連携
Google Analytics Premiumからのデータフィード (3回/1日)

GCP/AWS/SFDC
DB(MySQL, PostgreSQLなど)
その他、FTP、BI、SDK、SMP、外部データ等
サポート

エンタープライズ向けサポートが不足
標準サービスに含む 
→ チャットでインタラクティブに対応
→ SQL構文/性能改善にも対応

追加費用が発生
参考:ドリコムを支えるデータ分析基盤がTD+AWSに移行した話 http://ka-nipan.hatenablog.com/entry/2015/12/07/002702

料金体系

従量課金(ストリーミングインサート量、ストレージ量、クエリ数)月額固定
参考:BigQueryで150万円溶かした人の顔 http://qiita.com/itkr/items/745d54c781badc148bb9

スタンダード利用で月$3300
保存レコード上限:150億レコード、クエリ数等は制限無し
使い方を誤らなければ安い高いが大規模データを扱う際に料金を気にしなくても良い

機能面は、TDに軍配!
価格面は、BQに軍配!

という感じです。

自分の好みとしては、他社とのデータ連携を主要目的として利用したいので、現状TDの方が使いやすいです。
一方、GAP(Google Analytics Premium)をすでに利用しているとBQの月額料金が$500免除されるらしいので、それが事実であり、かつGAPユーザならBQ利用も検討の余地ありと思います。


0 件のコメント :

コメントを投稿