以前JRA-VANのデータをMySQLに入れましたが、それを使って機械学習する流れを紹介します。 使用するのは Python Jupyter Lab でロジスティック回帰を用いて、中山記念で3着以内に入る馬を予測します。 …
[続きをもっと見る…]
Pythonで機械学習入門 競馬予測
2021-04-01
以前JRA-VANのデータをMySQLに入れましたが、それを使って機械学習する流れを紹介します。 使用するのは Python Jupyter Lab でロジスティック回帰を用いて、中山記念で3着以内に入る馬を予測します。 …
[続きをもっと見る…]
netkeibaのapiからオッズ情報を取ってきて、券種別で人気順を見ていきます。 異常オッズと言っておきながらオッズの値は加味してないので、異常人気馬検知って感じでしょうか。 pandasのdatafra …
[続きをもっと見る…]
Seleniumを使って非同期のページをスクレイピングします。
Pythonからtwitterのデータ取ってくるのって簡単ですよね。 ConsumerKey取得などDeveloper画面もちょっと紹介 動画で使ったtokenなどはちゃんと消去済みです。 動 …
[続きをもっと見る…]
Jupyter Notebook 便利ですよね! REPL感覚で使えるけれど、REPLより使い勝手良いし、セルごとに何度もやり直しできるし、リンクを共有すればコードもさくっと共有できます。 Scala にも spark- …
[続きをもっと見る…]
今回から何回かに分けて、機械学習で日本酒の味のタイプのクラスタリングをする動画をやっていきたいと思います。 Part1はデータを取得するスクレイピング編です。 機械学習はまず、データを集めるところから始まります。 日本酒 …
[続きをもっと見る…]
Apache Spark Part3の番外編で自分のMacにspark入れてみます。 手順は以下の通り。 1.AnacondaのサイトからOS X用のパッケージをダウンロードしてきて、インスコ。インストール …
[続きをもっと見る…]