バツイチとインケンのエンジニアブログ
プログラムやプログラムじゃないこと

spark-notebook使ってみた

2015-08-10
書いた人 : バツイチ
カテゴリ : Spark | タグ : spark-notebook

notebook形式のWebUIでsparkを実行するspark-notebookを使ってみました。

https://github.com/andypetrella/spark-notebook

spark-notebookは、scala-notebookをforkして作ったそうなんですが、
元々のscala-notebookはiPython Notebookにフィーチャーされて作ったものだということで、
iPython Notebookユーザには非常に馴染みのあるインターフェイスになっています。

インストール

インストール方法はいくつか用意されています。

  1. バイナリファイル
  2. dockerイメージ
  3. debianパッケージ
  4. ソースコード

私はデバッグできるようにソースコードを使いました。
ソースコードを使う場合はsbtでビルドと起動を行います。

# GitHubからcloneします
$ git clone git@github.com:andypetrella/spark-notebook.git
$ cd spark-notebook
# sparkの最新バージョンを指定してsbtを実行します
$ sbt -D"spark.version"="1.4.1"
[info] Loading project definition from ./spark-notebook/project
[info] Set current project to spark-notebook (in build file:./spark-notebook/)
# サーバを起動します
[spark-notebook] $ run

ポート:9000でWebサーバが起動します。

notebookを使ってみる

ブラウザからhttp://localhost:9000にアクセスします。

spark-notebook_1

Jupyter(iPython Notebook)にそっくりです・・・
scala-notebook以上にJupyterです。

サンプルが沢山用意されているので、とりあえずサンプルを動かしてみます。
sqlの中のDataFrameを開きました。

spark-notebook_2

とりあえず上から動かしてみます。

spark-notebook_3

普通に動きます。
リスト型コンテナを作ると、表やグラフを表示することもできます。

spark-notebook_4

spark-notebook_5

spark-notebook_6

DataFrameを作成すると自動的に表を作ってくれます。

spark-notebook_7

D3.jsを使ったjsコンポーネントがいくつか用意されていて、デフォルトのビジュアライゼーションが結構充実していました。
※自分でD3.jsを使って描画することもできます。

spark-notebook_9

spark-notebook_11

想像以上に便利な印象でした。
地雷を踏むところまでもう少し使い込みたいところですw

このエントリーをはてなブックマークに追加
Tweet

← Spark Summit 2015へ行ってきました! ー レポートと感想
Youtuberやってみた →

 

最近書いた記事

  • Ryzen7 3800XT でmini ITXオープンフレームPCを作る
  • Pythonで機械学習入門 競馬予測
  • HP ENVY 15 クリエイターモデルレビューとRAID0解除
  • JRA-VAN データラボを使って、競馬データを収集する
  • Surface Pro 3 にubuntu18.04を入れる

カテゴリー

  • Android
  • Apache Flink
  • API
  • AWS
  • bazel
  • BigQuery
  • Cassandra
  • Docker
  • Druid
  • Elasticsearch
  • Git
  • Golang
  • gradle
  • HDFS
  • JavaScript
  • jvm
  • Linux
  • MongoDB
  • MySQL
  • Nginx
  • Nodejs
  • PaaS
  • PHP
  • Python
  • RabbitMQ
  • Raspberry Pi
  • React Native
  • Redis
  • Riak
  • rust
  • scala
  • Scheme
  • SEO
  • solr
  • Spark
  • spray
  • Sublime Text
  • Swift
  • Tableau
  • Unity
  • WebIDE
  • Wordpress
  • Youtube
  • ひとこと
  • カンファレンス
  • スケジューラ
  • マイクロマウス
  • 広告
  • 技術じゃないやつ
  • 株
  • 機械学習
  • 競馬
  • 自作キーボード
  • 自然言語処理

アーカイブ

  • 2021年4月
  • 2021年2月
  • 2021年1月
  • 2020年3月
  • 2020年2月
  • 2020年1月
  • 2019年10月
  • 2019年9月
  • 2019年8月
  • 2019年7月
  • 2019年6月
  • 2019年5月
  • 2019年4月
  • 2019年2月
  • 2019年1月
  • 2018年12月
  • 2018年11月
  • 2018年9月
  • 2018年5月
  • 2018年3月
  • 2018年2月
  • 2017年9月
  • 2017年8月
  • 2017年6月
  • 2017年4月
  • 2017年3月
  • 2017年1月
  • 2016年10月
  • 2016年9月
  • 2016年8月
  • 2016年6月
  • 2016年5月
  • 2016年4月
  • 2016年3月
  • 2016年2月
  • 2016年1月
  • 2015年12月
  • 2015年11月
  • 2015年10月
  • 2015年9月
  • 2015年8月
  • 2015年6月
  • 2015年5月
  • 2015年2月
  • 2015年1月
  • 2014年12月
  • 2014年11月
  • 2014年9月
  • 2014年6月
  • 2014年5月
  • 2014年3月
  • 2014年2月
  • 2014年1月
  • 2013年12月
  • 2013年11月
  • 2013年10月
  • 2013年9月
  • 2013年8月

書いた人

  • バツイチちゃん
  • インケンくん

このブログについて

エンジニアとしての考え方が間逆な2人がしょーもないこと書いてます。

バツイチ

アイコン

IT業界で働くエンジニアです。名前の通りバツイチです。
理論や抽象的概念が好きだけど人に説明するのが下手。

インケン

アイコン

バツイチちゃんと同じ業界で働いています。
理論とか開発手法とかは正直どうでもよくて、
生活する上で役に立つことに使いたい

Copyright 2025 バツイチとインケンのエンジニアブログ