「自分の好みの日本酒を機械学習で見つけよう」第3回目は分かち書きした単語のワードカウントを取りgensimでコーパスを作ります。 ipythonで作ったノートブックはこちら
機械学習で日本酒をクラスタリング Part3 コーパス編
2016-03-21
「自分の好みの日本酒を機械学習で見つけよう」第3回目は分かち書きした単語のワードカウントを取りgensimでコーパスを作ります。 ipythonで作ったノートブックはこちら
mecabの日本酒用語辞書をgithubに公開しました こんな感じで形態素解析できます。
「自分の好みの日本酒を機械学習で見つけよう」第2回目はレビューをmecabで分かち書きします。 レビューコメントは前回と同じようにこちらのサイトから、前回作ったsake.csvを基に銘柄ごとにスクレイピングして、revi …
[続きをもっと見る…]
今回から何回かに分けて、機械学習で日本酒の味のタイプのクラスタリングをする動画をやっていきたいと思います。 Part1はデータを取得するスクレイピング編です。 機械学習はまず、データを集めるところから始まります。 日本酒 …
[続きをもっと見る…]
tmux便利ですよね。 インケンはちょっと前まで「tmux? iterm2で全然事足りてるし」って思ってましたが、tmux実際に入れてみたら意外と便利だったので、動画にしてみました。 動画の中で紹介してる機能の詳細は以下 …
[続きをもっと見る…]
Docker管理ツールのkubernetesをやりました。 何度も撮り直しているのと、思ったように動かなくてテンション低めです。 続きは作られるのでしょうか!?
今回は初めてのtableauです。 前にバツイチちゃんが書いた、ことり隊入荷情報をSparkで分析してTableauで可視化するのデータを使ってダッシュボードを作りました。