重庆大学研究生数理统计大作业

  • 格式:doc
  • 大小:569.00 KB
  • 文档页数:11

下载文档原格式

  / 11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

NBA球员科比单场总得分与上场时间的线性回归分析

摘要

篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。

正文

一、问题描述

随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。

倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。

因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。

二、数据描述

抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:

以上数据由腾讯篮球中心提供,特此说明。

三、模型建立

(1)假设条件

假定球员每场的发挥均为独立同分布事件, (2)模型构建

以上场时间为自变量Xi ,单场得分为应变量Yi ,建立正态线性模型式:

()012

,1,2,

,;0,,,,,i i i i

i i i Y x i n N ββεεσεεε=++=⎧⎪⎨⎪⎩且相互独立 其中β0、β1为模型参数。 (3)模型求解 由数据记录资料:

()()()112

2,,,,

,

,n

n x y x y x y 用最小二乘法求得

回归方程:01y x ββ∧

∧∧

=+,其中()()

01

112

1

,()

n

i

i

i n

i

i x x y y y x x x βββ∧

∧∧

==--=

=--∑∑

若x0 表示x 某个固定的值,则相应的()2

001~,Y N x ββσ+

由于01,ββ 与22

21

1,(),2n

i i i Y Y n σσ∧∧==--∑是由历史数据得出, 因此2

001,,,Y ββσ∧ 相互独立。容易证得:

()

012

02011~,xx

x x x N x n l ββββσ∧

⎡⎤

⎡⎤-⎢⎥⎢⎥+++⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣

, 同时可推出0100Y x ββ∧∧

⎛⎫

-+ ⎪⎝⎭

服从正态分布,并能求得:

01000E Y x ββ∧

⎡⎤⎛⎫-+= ⎪⎢⎥⎝⎭⎣

⎦,()

012

020011xx x x D Y x n l ββσ∧

-⎡⎤⎛⎫⎢⎥-+=++ ⎪⎢⎥⎢⎥⎝⎭⎣⎦⎢⎥⎣

即:()

012

02001~0,1xx x x Y x N n l ββσ∧∧⎡⎤

⎡⎤-⎛⎫⎢

⎥⎢⎥-+++

⎪⎢⎥⎢⎥⎝⎭

⎢⎥⎢⎥⎣⎦⎣

, 由于i ε与01ββ∧∧

+均相互独立,故2

σ∧ 与0100Y x ββ∧∧

⎛⎫

-+ ⎪⎝⎭

相互独立, 又()()2

222~2n n σχσ∧--

故有:

()

0100~2ββ∧∧

⎛⎫-+ ⎪

=

-Y x T t n 。

因此,给定一个X0,再给出一个置信水平1-α,就可以求出相对应Y0的预测区间:

(

)(

)0011012012[22ββσββσ∧

∧∧∧

-∂-∂+--++-x t n x t n 当样本n 比较大时, 由于(

)12122,

1t

n u -∂-∂-≈≈,

于是Y 的置信水平为1-α的预测区间近似为:

001212,σσ∧∧∧∧

-∂-∂⎡⎤-+⎢⎥⎣⎦

y u y u 四、计算机设计方法与实现

(1)回归方程求解

数据如表2.1所示,事先去掉因伤病导致的缺席的数据点,经过观察分析,数据近似服从线性分布,求解的详细过程见附表1, 由数据计算得:

2

2

211()2998.286===-=-=∑∑n

n

xx i i i i l x x x nx

2

2

21

1

()6316.952===-=-=∑∑n

n

yy i i i i l y y y n y

1

()()2444.286==--=∑n

xy i i i l x x y y

根据最小二乘法原理得:

1

0.8152

3.6717

ββ∧

=+=-

回归方程为: 3.67170.8512∧

=-+y x 样本点与回归直线的关系如图4.1所示:

图4.1