研究室トップページへ / 卒業研究一覧へ

大阪工業大学 情報科学部 宇宙物理研究室 2008年度 卒業研究

「主成分分析と因子分析による競馬の勝因の研究」

学籍番号A04-133 情報科学科 名前 邉見 広大

2009/2/12 作成

概要 / 目次 / 卒業論文、プログラム/

概要

 主成分分析と因子分析を用いて、毎年12月に中山競馬場で行なわれる有馬記念のレース結果を予想した。主成分分析とは、勝因と考えられるいくつかの要素を線形結合し、相関行列の固有ベクトルを用いる分析である。因子分析とは、任意の主要素を求める際に、各要素の残余項を最小にするように求める分析である。主成分分析と因子分析の結果から、競馬で予想の時に用いられるデータのどれが実際に影響して良い成績を残したのかを調べ、2008年の有馬記念の出走馬に適用した。  データは、過去4年分の有馬記念の出走馬の成績と、過去4年分の中山競馬場2500mのレースで勝った馬の成績を標準化して用い、成績データは、右回り、左回り、競馬場、距離、GI、重賞競争の成績(1着、2着、3着、着外)の結果から3要素を決め、主成分得点、因子得点を計算するプログラムをC言語で作成した。要素を変えながら図示し、最も相関があると考えられる3要素を探した。 図1、2は過去の有馬記念から、右回りと競馬場を組み合わせ、距離、GIと重賞組み合わせた3要素をとり主成分得点と因子得点の図示し、2008年の有馬記念を予想に用いたものである。
図1.主成分分析の散布図
図2.因子分析の散布図
 主成分分析と因子分析は同様に分布するが、主成分分析はデータが楕円状に分布し、因子分析はデータが円状に分布する事がわかった。どちらも分析固有の性質が明確に出た。図1の第1主成分得点は3つの要素が高い馬がプラスを表し、第2主成分得点はマイナスなcら距離の要素が高く、プラスなら残りの要素が高いことを表した。図2の第1因子得点は、距離以外の要素で説明でき、第2因子は距離の要素だけで説明できた。  主成分、因子分析ともに右上のほうに集まるように相関が見えるため、2008年の有馬記念の予想は馬番の順に6番、9番、11番、13番で、特に主成分、因子ともに右上に来ている9番と13番が勝つ確率が高いという結果になった。実際のレースの結果は1着から13番、14番、6番の順であった。研究結果から、2頭入選したことになった。


目次

  1. 序論
     1.1 背景
     1.2 本研究の内容
     1.3 本論文の構成

  2. 主成分分析
     2.1 合成変量の構成
     2.2 合成変量の分散の最大化
     2.3 寄与率
     2.4 標準化
        2.4.1 変量の標準化
        2.4.2 新変量の分散共分散行列

  3. 因子分析
     3.1 因子分析の構成
     3.2 相関行列の分解
     3.3 因子負荷量の推定方法
     3.4 共通性と独自性
     3.5 単純化構造の発見
     3.5.1 単純化構造の説明
     3.5.2 基準バリマックス法
     3.6 因子得点の推定方法

  4. 分析の方法
     4.1 計算プログラムについて
     4.2 計算方法

  5. 結果
     5.1 中山2500mを用いての結果
      5.1.1 中山2500mの主成分分析の結果
      5.1.2 中山2500mの因子分析の結果
      5.1.3 中山2500mからの結果の考察
     5.2 過去有馬記念を用いての結果1
      5.2.1 過去有馬記念の主成分分析の結果1
      5.2.2 過去有馬記念を用いての因子分析の結果1
      5.2.3 過去有馬記念からの結果の考察1
     5.3 過去有馬記念を用いての結果1
      5.3.1 過去有馬記念の主成分分析の結果1
      5.3.2 過去有馬記念を用いての因子分析の結果1
      5.3.3 過去有馬記念からの結果の考察1
     5.4 研究の結果と実際の結果

  6. まとめと展望


卒業論文、プログラム

  • 卒業論文 [pdf] (4.0MB)

    Copyright (c) 邉見 広大 kodai Henmi 2009. All rights reserved.