バツイチとインケンのエンジニアブログ
プログラムやプログラムじゃないこと

Strata+Hadoop Worldカンファレンス2〜3日目

2014-11-20
書いた人 : バツイチ
カテゴリ : カンファレンス | タグ : Big Data, strata

Strata+Hadoop Worldカンファレンスの2日目と3日目です。

2日目、3日目は注目セッションもたくさんあったのですが、スポンサー・パビリオンも外せませんでした。

2〜3日目の注目セッション

SAMOA: A Platform for Mining Big Data Streams
Gianmarco De Francisci Morales (Yahoo Labs)

Yahoo Labsが開発したストリーミング機械学習フレームワーク、SAMOAの話です。
サイトにスライドもあがっています。

A Gentle Introduction to Apache Spark and Clustering for Anomaly Detection
Sean Owen (Cloudera)

KDD Cup ‘99のデータを使ってSparkでK-meansクラスタリングを行う話。

Building a Unified Data Pipeline in Spark
Aaron Davidson (Databricks)

Scala Matsuri2014の際にも来日してくださったDatabricksのAaronさんのセッション。
内容はScala Matsuriと同様、Spark Streamingを使ってTwitterツイートの言語推定するというものでした。

IMG_2969

IMG_2967

Databricks Cloudを使ってどんどん流れてくるツイートをリアルタイムで言語推定する様子は、
このカンファレンスにおいても会場内にどよめきが起こりました。
Databricks Cloudは2015年2〜3月サービスインを目指して現在絶賛試験中だそうです。

From Raw Data to Analytics with No ETL
Marcel Kornacker (Cloudera, Inc.)
これはすごいです。「No ETL」を謳っています。
Imparaでデータの自動変換を行うという話です。
これもスライドがあがってます。

Predictive Analytics in the Cloud: Predicting Football
Jordan Tigani (Google )

このセッションは何がすごいって、スピーカーがすごいです。
Jordan TiganiさんはGoogleのあのBigQueryの共作者です。
こちらはビデオもスライドも上がっています。

Telling Meaningful Stories With Data
Daniel Waisberg (Google)

Googleのデータ分析主導者でonline-behavior.comの創設者であるDaniel WaisbergさんのKey Note。
Daniel Waisbergさんは行動分析の第一人者ですね。

How Search Can Save Your Hadoop Investment and More
Shay Banon (Elasticsearch)

ElasticSearchの作者、Shay Banonさんのセッションです。

IMG_3034

IMG_3037

内容的にはApache Sparkのサポートがメインでした。
最後に少しだけ、Elastic{ON}15(ElasticSearch のカンファレンス)の紹介をされていました( ̄ー ̄)

スポンサー・パビリオン

スポンサー・パビリオンには、主催者のCloudera, O’Reillyのブースをはじめ、DatabricksやElastic Search、RedHatなどのおなじみの企業が並んでいました。

IMG_3028

企業ブースにはスピーカーが現れることもあります。
※上の写真はAaron Davidsonさん。

15215784863_1f748fa26a_k

ネームホルダーを見せるとTシャツなどのプライズをもらえます。

15656992390_48b9ab39b7_k

ちなみにRedHatは赤い帽子がプライズでしたw

15811566456_3e0b935fbb_k

O’Reillyのブースでは、O’Reilly本の著者のサイン会が行われました。
著者にサインをいただける上、本もただで貰えてしまいますΣ(゚∀゚ノ)ノ

2〜3日まとめ

カンファレンスを通して印象的だったのは、とにかくもう、
Apache Spark一択だよね
という空気感でした。
メインスポンサーがClouderaだったからかもしれませんが。。。

DatabricksのHossein Falakiさんがセッションの中で述べていた、Hadoopを超えていくSparkに尽きると思いました。

Hadoop vs Spark

このエントリーをはてなブックマークに追加
Tweet

← Strata+Hadoop Worldカンファレンス1日目
5分でできるHDFSクラスタ構築方法 →

 

最近書いた記事

  • Ryzen7 3800XT でmini ITXオープンフレームPCを作る
  • Pythonで機械学習入門 競馬予測
  • HP ENVY 15 クリエイターモデルレビューとRAID0解除
  • JRA-VAN データラボを使って、競馬データを収集する
  • Surface Pro 3 にubuntu18.04を入れる

カテゴリー

  • Android
  • Apache Flink
  • API
  • AWS
  • bazel
  • BigQuery
  • Cassandra
  • Docker
  • Druid
  • Elasticsearch
  • Git
  • Golang
  • gradle
  • HDFS
  • JavaScript
  • jvm
  • Linux
  • MongoDB
  • MySQL
  • Nginx
  • Nodejs
  • PaaS
  • PHP
  • Python
  • RabbitMQ
  • Raspberry Pi
  • React Native
  • Redis
  • Riak
  • rust
  • scala
  • Scheme
  • SEO
  • solr
  • Spark
  • spray
  • Sublime Text
  • Swift
  • Tableau
  • Unity
  • WebIDE
  • Wordpress
  • Youtube
  • ひとこと
  • カンファレンス
  • スケジューラ
  • マイクロマウス
  • 広告
  • 技術じゃないやつ
  • 株
  • 機械学習
  • 競馬
  • 自作キーボード
  • 自然言語処理

アーカイブ

  • 2021年4月
  • 2021年2月
  • 2021年1月
  • 2020年3月
  • 2020年2月
  • 2020年1月
  • 2019年10月
  • 2019年9月
  • 2019年8月
  • 2019年7月
  • 2019年6月
  • 2019年5月
  • 2019年4月
  • 2019年2月
  • 2019年1月
  • 2018年12月
  • 2018年11月
  • 2018年9月
  • 2018年5月
  • 2018年3月
  • 2018年2月
  • 2017年9月
  • 2017年8月
  • 2017年6月
  • 2017年4月
  • 2017年3月
  • 2017年1月
  • 2016年10月
  • 2016年9月
  • 2016年8月
  • 2016年6月
  • 2016年5月
  • 2016年4月
  • 2016年3月
  • 2016年2月
  • 2016年1月
  • 2015年12月
  • 2015年11月
  • 2015年10月
  • 2015年9月
  • 2015年8月
  • 2015年6月
  • 2015年5月
  • 2015年2月
  • 2015年1月
  • 2014年12月
  • 2014年11月
  • 2014年9月
  • 2014年6月
  • 2014年5月
  • 2014年3月
  • 2014年2月
  • 2014年1月
  • 2013年12月
  • 2013年11月
  • 2013年10月
  • 2013年9月
  • 2013年8月

書いた人

  • バツイチちゃん
  • インケンくん

このブログについて

エンジニアとしての考え方が間逆な2人がしょーもないこと書いてます。

バツイチ

アイコン

IT業界で働くエンジニアです。名前の通りバツイチです。
理論や抽象的概念が好きだけど人に説明するのが下手。

インケン

アイコン

バツイチちゃんと同じ業界で働いています。
理論とか開発手法とかは正直どうでもよくて、
生活する上で役に立つことに使いたい

Copyright 2025 バツイチとインケンのエンジニアブログ