经济文库 - 千万精品文档,你想要的都能搜到,下载即用。

高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc

※ Tiredness (疲惫)12 页 514.5 KB 访问 972.97下载文档
高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc
当前文档共12页 2.97
下载后继续阅读

高中数学复习学(教)案(第72讲) 正态分布和线性回归 - 中学数学优秀案例 - 数学与统计学院.doc

高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 题目 (选修Ⅱ)第一章概率与统计 正态分布和线性回归 高考要求 1.了解正态分布的意义及主要性质 2.了解线性回归的方法和简单应用 知识点归纳 1.正态分布密度函数: ( x- m)2 1 2 f (x) = e 2s ,(σ>0,-∞<x<∞) 2ps 其中π是圆周率;e 是自然对数的底;x 是随机变量的取值;μ为正态分布 2 的均值;σ是正态分布的标准差.正态分布一般记为 N ( , ) 2 2.正态分布 N ( , ) )是由均值μ和标准差σ唯一决定的分布 y y y u=0 O x u=-1 O x O u=1 x 3.正 态 曲 线 的 性 质 : 正态分布由参数μ、σ唯一确定,如果随机变 量  ~N(μ,σ2),根据定义有:μ=E  ,σ=D  。 正态曲线具有以下性质: (1)曲线在 x 轴的上方,与 x 轴不相交。 (2)曲线关于直线 x =μ对称。 (3)曲线在 x =μ时位于最高点。 (4)当 x <μ时,曲线上升;当 x >μ时,曲线下降。并且当曲线向左、 右两边无限延伸时,以 x 轴为渐近线,向它无限靠近。 (5)当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表 示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。 五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的 原则,采用对比教学 4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其 相应的函数表示式是 f (x)  1 2  x2 e 2 ,(-∞<x<+∞) 其相应的曲线称为标准正态曲线 标准正态总体 N(0,1)在正态总体的研究中占有重要的地位 任何正 态分布的概率问题均可转化成标准正态分布的概率问题 5.标准正态总体的概率问题: 源头学子小屋 http://www.xjktyg.com/wxc/ wxckt@126.com 第 1 页 共 12 页 高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 对于标准正态总体 N(0,1) ,  (x0 ) 是总体取值小于 x0 的概率, 即  (x0 )  P (x  x0 ) , 其中 x0  0 ,图中阴影部分的面积表示为概率 P (x 120) =1- P (x £ 120) =1- F ç  120 分以上的考生人数为 1000×0.023=23 x  ) 转化成标准正态总体,然后查标准 点评:通过公式 F (x)   (  正态分布表即可 例 4 将温度调节器放置在贮存着某种液体的容器内,调节器设定在 d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N(d,0.52). (1)若 d=90°,求ξ<89 的概率; (2)若要保持液体的温度至少为 80 ℃的概率不低于 0.99,问 d 至少 是多少? (其中若η~N(0,1),则Φ(2)=P(η<2)=0.9772,Φ(-2.327) =P(η<-2.327)=0.01). 分析:(1)要求 P(ξ<89)=F(89) , ∵ ξ ~N(d,0.5)不是标准正态分布,而给出的是 Φ (2), Φ (- 2.327) ,故需转化为标准正态分布的数值. (2)转化为标准正态分布下的数值求概率 p,再利用 p≥0.99,解 d. 解:(1)P(ξ<89)=F(89)=Φ( 89 90 ) 0.5 =Φ(-2)=1-Φ(2)=1-0.9772=0.0228. (2)由已知 d 满足 0.99≤P(ξ≥80) , 即 1-P(ξ<80)≥1-0.01,∴P(ξ<80)≤0.01. ∴Φ( ∴ 80 d )≤0.01=Φ(-2.327). 0.5 80 d ≤-2.327. 0.5 ∴d≤81.1635. 故 d 至少为 81.1635. 点评:(1)若ξ~N(0,1),则η=  ~N(0,1).(2)标准正  态分布的密度函数 f(x)是偶函数,x<0 时,f(x)为增函数,x>0 时,f 源头学子小屋 http://www.xjktyg.com/wxc/ wxckt@126.com 第 6 页 共 12 页 高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 (x)为减函数. 例 5 在实际生活中,常用统计中假设检验的思想检验产品是否合格, 方法是: (1)提出统计假设:某种指标服从正态分布 N(μ,σ2); (2)确定一次试验中的取值 a; (3)作出统计推断:若 a∈(μ-3σ,μ+3σ) ,则接受假设,若 a  (μ-3σ,μ+3σ) ,则拒绝假设. 某砖瓦厂生产的砖的“抗断强度”ξ服从正态分布 N(30,0.8) ,质检人 员从该厂某一天生产的 1000 块砖中随机抽查一块,测得它的抗断强度为 27.5 kg/cm2,你认为该厂这天生产的这批砖是否合格?为什么? 解:由于在一次试验中ξ落在区间(μ-3σ,μ+3σ)内的概率为 0.997,故ξ几乎必然落在上述区间内. 于是把μ=30,σ=0.8 代入, 算出区间(μ-3σ,μ+3σ)=(27.6,32.4), 而 27.5  (27.6,32.4) .∴据此认为这批砖不合格. 例 6 已知测量误差ξ~N(2,100)(cm),必须进行多少次测量,才 能使至少有一次测量误差的绝对值不超过 8 cm 的频率大于 0.9? 解:设η表示 n 次测量中绝对误差不超过 8 cm 的次数,则η~B(n, p). 其中 P=P(| ξ |<8)= Φ ( 8 2 8 2 )- Φ ( )= Φ (0.6)-1+ Φ 10 10 (1)=0.7258-1+0.8413=0.5671. 由题意,∵P(η≥1)>0.9,n 应满足 P(η≥1)=1-P(η=0)=1- (1-p)n>0.9, lg(1 0.9) 1 ∴n> = =2.75. lg(1 0.5671 ) lg0.4329 因此,至少要进行 3 次测量,才能使至少有一次误差的绝对值不超过 8 cm 的概率大于 0.9. 例 7 已知某地每单位面积菜地年平均使用氮肥量 xkg 与每单位面积蔬 菜年平均产量 yt 之间的关系有如下数据: 1985 1986 1987 1988 1989 1990 1991 1992 年份 x(kg) 70 74 80 78 85 92 90 95 y(t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 年份 x(kg) y(t) 1993 92 11.5 1994 108 11.0 1995 115 11.8 源头学子小屋 http://www.xjktyg.com/wxc/ 1996 123 12.2 1997 130 12.5 1998 138 12.8 1999 145 13.0 wxckt@126.com 第 7 页 共 12 页 高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 (1)求 x 与 y 之间的相关系数,并检验是否线性相关; (2)若线性相关,求蔬菜产量 y 与使用氮肥量之间的回归直线方程, 并估计每单位面积施肥 150kg 时,每单位面积蔬菜的年平均产量。 分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性 水平 0.05 与自由度 15-2 相应的相关系数临界 r0.05比较,若 r  r0.05则线性 相关,否则不线性相关。 解:(1)列出下表,并用科学计算器进行有关计算: i xi yi xi yi 1 70 2 74 3 80 4 78 5 85 6 92 7 90 8 95 9 92 10 108 11 115 12 123 13 130 14 138 15 145 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 11.5 11.0 11.8 12.2 12.5 12.8 13.0 357 444 544 608.4 765 938.4 900 1140 1058 1188 1357 1500.6 1625 1766.4 1885 x 15 1515 151.7  101, y   10.11, 15 15 15 15 i xi  161125, i yi  1628.55, i xi yi  16076.8。 2 1 2 1 1 故蔬菜产量与放用氮肥量的相关系数 r 16076 .8  1510110.11 2 2 (161125  15101)(1628 .55 1510.11 )  0.8643。 由于 n=15,故自由度 15-2=13。 由相关系数检验的临界值表查出与显著水平 0.05 及自由度 13 相关系 数临界值 r0.05  0.514,则 r  r0.05, 从而说明蔬菜产量与氮肥量之间存在着线性相关关系。 (2)设所求的回归直线方程为 y^  bx a ,则 15 i xi yi 15xy 16076.81510110.11 1 b  15 2 i xi 15x 2  161125  151012  0.0937, 1 a  y  bx  10.11 0.0937101 0.6463, ^ ∴回归直线方程为 y  0.0937 x  0.6463 14.701(t) 。 点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大, n 需要细心、 谨慎地计算。 如果会使用含统计的科学计算器,能简单得到 i xi , 1 源头学子小屋 http://www.xjktyg.com/wxc/ wxckt@126.com 第 8 页 共 12 页 高中数学复习教(学)案 n n 1 1 n 新疆奎屯市第一高级中学 王新敞 n yi ,  yi ,  yi ,  xi yi 这些量,也就无需有制表这一步,直接  i i i i 2 2 1 1 算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数据进行 处理。 例 8 假设关于某设备的使用年限 x 和所支出的维修费用 y(万元),有如 下的统计资料: x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0 若由资料可知 y 对 x 呈线性相关关系。试求: (1)线性回归方程; (2)估计使用年限为 10 年时,维修费用是多少? 分析:本题为了降低难度,告诉了 y 与 x 间呈线性相关关系,目的是训 练公式的使用。 解:(1)列表如下: i 1 2 3 4 5 2 3 4 5 6 xi yi xi yi 2.2 3.8 5.5 6.5 7.0 4.4 11.4 22.0 32.5 42.0 xi2 4 9 16 25 36 5 5 i 1 i 1  xi2  90,  xi yi  112.3 x  4 , y  5, 5 于是 b  i xi yi  5xy 112.3 5 4 5 1 5 2 i xi  5x 2  90 5 42  1.23, 1 a  y  bx 5  1.23 4  0.08。 ^ ∴线性回归方程为: y  bx a  1.23x  0.08。 ^ (2)当 x=10 时, y  1.2310 0.08 12.38(万元) 即估计使用 10 年时维修费用是 12.38 万元。 点评:本题若没有告诉我们 y 与 x 间是呈线性相关的,应首先进行相关 性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系 不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可 信的。 小结: 1.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增 源头学子小屋 http://www.xjktyg.com/wxc/ wxckt@126.com 第 9 页 共 12 页 高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线 ——反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系, 且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个 样本,用样本的频率分布去估计相应的总体分布. 2.统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不 可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出 判断:是拒绝假设,还是接受假设. 学生练习 1.下面哪有个数不为总体特征数的是(D) A.总体平均数 B.总体方差 C.总体标准差 D.总体样本 答案:D 2.设随机变量  服从二项分布 B(6, A. 5 16 B. 3 16 C. 5 8 D. 1 ),则 P(  =3)=(A) 2 3 8 答案:A 3.设随机变量ξ~N(μ,σ) ,且 P(ξ≤C)=P(ξ>C) ,则 C 等于 A.0 B.σ C.-μ D.μ 解析:由正态曲线的图象关于直线 x=μ对称可得答案为 D. 答案:D 4.如果随机变量ξ~N(μ,σ2) ,且 Eξ=3,Dξ=1,则 P(-1<ξ≤1) 等于 A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2) 解析:对正态分布,μ=Eξ=3,σ2=Dξ=1,故 P(-1<ξ≤1)=Φ(1 -3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B 5.某厂生产的零件外直径ξ~N(8.0,1.52) (mm),今从该厂上、下午生产 的零件中各随机取出一个,测得其外直径分别为 7.9 mm 和 7.5 mm,则可认 为 A.上、下午生产情况均为正常 B.上、下午生产情况均为异常 C.上午生产情况正常,下午生产情况异常 D.上午生产情况异常,下午生产情况正常 解析:根据 3σ原则,在 8+3×1.5=8.45(mm)与 8-3×1.5=7.55(mm) 之外时为异常. 答案:C 6.随机变量ξ服从正态分布 N(0,1) ,如果 P(ξ<1)=0.8413,求 P(-1< 源头学子小屋 http://www.xjktyg.com/wxc/ wxckt@126.com 第 10 页 共 12 页 高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 ξ<0). 解:∵ξ~N(0,1),∴P(-1<ξ<0)=P(0<ξ<1)=Φ(1)-Φ (0)=0.8413-0.5=0.3413. 7.公共汽车门的高度是按照确保 99%以上的成年男子头部不跟车门顶部碰 撞设计的,如果某地成年男子的身高ξ~N(173,72)(cm),问车门应设 计多高? 解:设公共汽车门的设计高度为 x cm,由题意,需使 P( ξ ≥x)< 1%. ∵ξ~N(173,72),∴P(ξ≤x)=Φ( 查表得 x  173 7 )>0.99. x  173 7 >2.33,∴x>189.31,即公共汽车门的高度应设计为 190 cm,可确保 99%以上的成年男子头部不跟车门顶部碰撞. 8.一投资者在两个投资方案中选择一个,这两个投资方案的利润 x(万元) 分别服从正态分布 N(8,32)和 N(6,22),投资者要求利润超过 5 万元的 概率尽量地大,那么他应选择哪一个方案? 解:对第一个方案,有 x~N(8,32) , 于是 P(x>5)=1-P(x≤5)=1-F(5)=1-Φ( 5 8 ) 3 =1-Φ(-1)=1-[1-Φ(1)]=Φ(1)=0.8413. 对第二个方案,有 x~N(6,22) , 于是 P(x>5)=1-P(x≤5)=1-F(5)=1-Φ( 5 6 ) 2 =1-Φ(-0.5)=Φ(0.5)=0.6915. 相比之下,“利润超过 5 万元”的概率以第一个方案为好,可选第一个 方案. 9.为考虑广告费用 x 与销售额 y 之间的关系,抽取了 5 家餐厅,得到如下数 据: 广告费用(千元) 1.0 4.0 6.0 10.0 14.0 销售额(千元) 19.0 44.0 40.0 52.0 53.0 现要使销售额达到 6 万元,则需广告费用为_____(保留两位有效数字) 解析:先求出回归方程 ŷ =bx+a,令 ŷ =6,得 x=1.5 万元. 答案:1.5 万元 10.设随机变量ε服从 N(0,1) ,求下列各式的值: (1)P(ε≥2.55); (2)P(ε<-1.44); (3)P(|ε|<1.52)。 分析:一个随机变量若服从标准正态分布,可以借助于标准正态分布表, 查出其值。但在标准正态分布表中只给出了 x0  0 ,即 P (x  x0 )  (x0 ) 源头学子小屋 http://www.xjktyg.com/wxc/ wxckt@126.com 第 11 页 共 12 页 高中数学复习教(学)案 新疆奎屯市第一高级中学 王新敞 的情形,对于其它情形一般用公式:φ(-x)=1-φ(x);p(a

相关文章