今回で酒機械学習最終回の4回目は、文章を特徴ベクトルに変換し、K-meansでクラスタリングしていきます。 その後、クラスタリングしたデータをTableauで可視化していきます。 文章を特徴ベクトルに変換するとはの図
機械学習で日本酒をクラスタリング Part4 K-means(k平均法)編
2016-03-27
今回で酒機械学習最終回の4回目は、文章を特徴ベクトルに変換し、K-meansでクラスタリングしていきます。 その後、クラスタリングしたデータをTableauで可視化していきます。 文章を特徴ベクトルに変換するとはの図
「自分の好みの日本酒を機械学習で見つけよう」第3回目は分かち書きした単語のワードカウントを取りgensimでコーパスを作ります。 ipythonで作ったノートブックはこちら
mecabの日本酒用語辞書をgithubに公開しました こんな感じで形態素解析できます。
「自分の好みの日本酒を機械学習で見つけよう」第2回目はレビューをmecabで分かち書きします。 レビューコメントは前回と同じようにこちらのサイトから、前回作ったsake.csvを基に銘柄ごとにスクレイピングして、revi …
[続きをもっと見る…]
今回から何回かに分けて、機械学習で日本酒の味のタイプのクラスタリングをする動画をやっていきたいと思います。 Part1はデータを取得するスクレイピング編です。 機械学習はまず、データを集めるところから始まります。 日本酒 …
[続きをもっと見る…]