データ分析の練習に競馬KLAN(クラン)などを参考にする

シェアしていただけると励みになります!

練習するイメージ画像

前回の記事をご覧いただいた方は、GUIツールとMySQLの使用法は何となくでもイメージしていただけたのではないでしょうか?

出馬表を作ってGUIツールとMySQLの2つを一気に理解しよう!
私はGUIツールは勿論、データベースもプログラムも、いまだに初心者です。無論プログラムなどはコピペプログラマーですので、人に何か教えれる立場...

今回は、更にデータ分析の具体的なイメージを理解していただける例を、競馬KLAN(クラン)などを紹介してみたいと思います。

SPONSORED LINK
アドセンス

まず初めに、競馬KLAN(クラン)って何?

JRA-VANと同じく、競馬データベースです。競馬ソフトを作成しようと思えば、ほぼ必然的にJRA-VANのデータをダウンロードし、私たちは、そのデータを利用する事になるかと思います。競馬KLAN(クラン)は同じ競馬データベースでありながら、PCにダウンロードする必要がなく、ブラウザで馬柱や、各馬の戦歴などが見れる競馬データベースサイトになります。

JRA-VANとの明確な違いは次の通りです。

  • データをダウンロードする必要が無い競馬データベースサイトである。
  • スピード指数や、穴馬ピックアップなど、JRA-VANにはないデータがある。
  • 無料で利用でき、即PATと連携しているので馬券も買える。(私はこれで投票しています)

などが、上げられる。本来、馬券を購入してもらう努力として、Data Lab.データやグリーンチャンネルなど、無料で開放するべきものだと思うので、無料で利用できるという所は、JRAに見習ってもらいたいものですね。

さて、競馬KLAN(クラン)は無料と言いましたが、馬券師の間では結構人気があるサイトである。見たいデータは人それぞれ多種多様である競馬というカテゴリーにおいて、人気サイトというのは、それぞれの要望に応える必要がある。

無料だからと言って、見たいデータが無い場合、進化したネット社会では誰も見向きもしないはずである。そんな中で人気があるのには理由がある。

JRA-VANに無いデータがある

例えば、前半3Fタイム。これはJRA-VANからは提供されていないので、このデータが必要になった時には、MySQLで自分で作成しないといけない。現在、この記事を読まれている方が果たして前半3Fタイムが必要なのかは分かりませんが、1つの例として考えていただきたいと思う。

MySQLで計算式を入れて、前半3Fタイムを計算したとする。JRA-VANからは 前半3Fタイムデータの提供がないので、その答えが、正しく出せているのかは分からない。想像してみて欲しい。前半3Fタイムが正確かどうか判断するのに競馬新聞で1頭づつ比較するということを(笑)

競馬KLAN(クラン)はデータ分析の練習に最適

また、出馬表を作成する時なども同じPC画面に出力することから、非常に参考になる。前回の記事で取り上げたリレーションしたデータがINNER JOINを利用している時、例えば新馬戦や、初出走の馬が居るときなどは、画面が表示されない(歯抜けデータになってしまったり)時などに、私は競馬KLAN(クラン)の出馬表と自分の作った出馬表を見比べてデータの歯抜けが無いかなどチェックしたりしている。この時覚えたのが LEFT JOINだ。(笑)

予想から馬券購入まで、無料で使えるあなた専用の競馬データベース【KLAN.jp】

前半3Fタイムについて

前半3Fタイムについても言える事だが、JRA-VANにはないデータが色々ある。完全にまねたりすると、それはオリジナルとは言えないが、これはどうやって実現させているのだろうと考える一つの材料になる。そういった意味で(私の求めるものが)競馬KLAN(クラン)にはある。

前置きが長くなってしまったので、本題に移ります。JRA-VANに無いデータをどうやって、競馬KLAN(クラン)は出しているのだろう?

前半3Fタイムはそもそも、1頭1頭計測しているようで、各新聞違うものでありどの新聞を信頼していいのか分からない。

TARGET frontierJVでは、AVG-3Fという方式を採用しており、その計算式は次の通りである。

Ave-3Fとは、レース全体のタイムから上がり3ハロンのタイムを引いたタイムを、その残りの距離で割って3ハロン分に換算したものです。つまり、上がり3ハロンの位置までの前半の3ハロン平均タイムになります。速度は距離をタイムで割ったものですから、このタイムと上がり3ハロンタイムの2つの数値の比較だけで、速度の変化がわかります。つまり、その位置の前後でどの程度のスピードの差があったのかということを判定しやすくしてあります。
出典:TARGET frontierJV AVE-3F

(走破タイム-上がりタイム)x600

Ave-3F =———————-

距離-600

MySQLでこれを表示させてみる。(データ分析の練習になる)表示させたデータを基に、どういったデータに加工するのかは自分次第になってくる。

完成した段階では、次のような例が誰も使用していないオリジナルと言えるだろう。(販売されているので自分だけが使用する完全オリジナルとは言えないが)

前走の小倉大賞典の自身のラップは、前半35秒9-後半34秒9。まず「①前走の”自身前半3F”と”基準前半3F”を比較する」。ちなみに”基準前半3F”とは、古馬500万・上位3頭の時計を目安に設定。小倉1800mの”基準前半3F”は36秒2なので、基準より0秒3速いことになります。これを近5走ほど参考にしてみます。
出典:【HB新聞】企業秘密ですか?

(AVE-3F)-(平均値、中央値、最頻値など)かな?このようにやりたい事を一つ一つ実現させていけば、完全オリジナルの馬券術の完成だ。

このような分析をするにあたっては、基本統計量はマスターしておきたい。

競馬に勝つためのデータ分析の有用性を考えてみた
競馬を予想するにあたって、一般の馬券師は馬のタイム・騎手・厩舎・血統・オッズなどから予測し、予想することだと思いますが、そのほとんどは単...
SPONSORED LINK
アドセンス
楽天336×280

シェアしていただけると励みになります!

コメントをどうぞ

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">