Strata+Hadoop Worldカンファレンス２〜３日目

Strata+Hadoop Worldカンファレンスの２日目と３日目です。

２日目、３日目は注目セッションもたくさんあったのですが、スポンサー・パビリオンも外せませんでした。

２〜３日目の注目セッション

SAMOA: A Platform for Mining Big Data Streams
Gianmarco De Francisci Morales (Yahoo Labs)

Yahoo Labsが開発したストリーミング機械学習フレームワーク、SAMOAの話です。
サイトにスライドもあがっています。

KDD Cup ‘99のデータを使ってSparkでK-meansクラスタリングを行う話。

Scala Matsuri2014の際にも来日してくださったDatabricksのAaronさんのセッション。
内容はScala Matsuriと同様、Spark Streamingを使ってTwitterツイートの言語推定するというものでした。

Databricks Cloudを使ってどんどん流れてくるツイートをリアルタイムで言語推定する様子は、
このカンファレンスにおいても会場内にどよめきが起こりました。
Databricks Cloudは2015年2〜3月サービスインを目指して現在絶賛試験中だそうです。

From Raw Data to Analytics with No ETL
Marcel Kornacker (Cloudera, Inc.)
これはすごいです。「No ETL」を謳っています。
Imparaでデータの自動変換を行うという話です。
これもスライドがあがってます。

このセッションは何がすごいって、スピーカーがすごいです。
Jordan TiganiさんはGoogleのあのBigQueryの共作者です。
こちらはビデオもスライドも上がっています。

Googleのデータ分析主導者でonline-behavior.comの創設者であるDaniel WaisbergさんのKey Note。
Daniel Waisbergさんは行動分析の第一人者ですね。

ElasticSearchの作者、Shay Banonさんのセッションです。

内容的にはApache Sparkのサポートがメインでした。
最後に少しだけ、Elastic{ON}15(ElasticSearch のカンファレンス)の紹介をされていました(￣ー￣)

スポンサー・パビリオンには、主催者のCloudera, O’Reillyのブースをはじめ、DatabricksやElastic Search、RedHatなどのおなじみの企業が並んでいました。

企業ブースにはスピーカーが現れることもあります。
※上の写真はAaron Davidsonさん。

ネームホルダーを見せるとTシャツなどのプライズをもらえます。

ちなみにRedHatは赤い帽子がプライズでしたｗ

O’Reillyのブースでは、O’Reilly本の著者のサイン会が行われました。
著者にサインをいただける上、本もただで貰えてしまいますΣ(ﾟ∀ﾟﾉ)ﾉ

カンファレンスを通して印象的だったのは、とにかくもう、
Apache Spark一択だよね
という空気感でした。
メインスポンサーがClouderaだったからかもしれませんが。。。

DatabricksのHossein Falakiさんがセッションの中で述べていた、Hadoopを超えていくSparkに尽きると思いました。