第一章统计案例检测试卷(带答案和解释)

作者:佚名 资料来源:网络 点击数:    有奖投稿

第一章统计案例检测试卷(带答案和解释)

本资料为WORD文档,请点击下载地址下载
文 章来源
莲山 课件 w w w.5Y k J.C om

阶段质量检测(一) 统计案例
(时间120分钟 满分150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^x中,回归系数b^(  )
A.可以小于0      B.大于0
C.能等于0   D.只能小于0
解析:选A ∵b^=0时,则r=0,这时不具有线性相关关系,但b^可以大于0也可以小于0.
2.每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程y^=56+8x,下列说法正确的是(  )
A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
解析:选C 根据回归方程知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位.
3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是(  )
x 4 5 6 7 8 9 10
y 14 18 19 20 23 25 28

A.线性函数模型   B.二次函数模型
C.指数函数模型   D.对数函数模型
解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.
4.试验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为(  )
A.y^=x+1  B. y^=x+2
C.y^=2x+1  D.y^=x-1
解析:选A 由题意发现,(x,y)的四组值均满足y^=x+1,故y^=x+1为回归直线方程.

5.下列关于等高条形图说法正确的是(  )
A.等高条形图表示高度相对的条形图
B.等高条形图表示的是分类变量的频数
C.等高条形图表示的是分类变量的百分比
D.等高条形图表示的是分类变量的实际高度
解析:选C 由等高条形图的特点及性质进行判断.
6.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析存在线性相关关系,求得其回归方程y^=0.85x-85.7,则在样本点(165,57)处的残差为(  )
A.54.55   B.2.45
C.3.45   D.111.55
解析:选B 把x=165代入y^=0.85x-85.7,得y=0.85×165-85.7=54.55,由57-54.55=2.45,故选B.
7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
 优秀 非优秀 总计 
甲班 10 b  
乙班 c 30  
总计   105 

已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是(  )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=105×10×30-20×45255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.
8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y^=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(  )
A.83%   B.72%
C.67%   D.66%
解析:选A 将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.
9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:

 年龄 总计
 不超过40岁 超过40岁 
吸烟量不多于
20支/天 50 15 65
吸烟量多于
20支/天 10 25 35
总计 60 40 100

则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关(  )
A.0.001   B.0.01
C.0.05   D.没有理由
解析:选A K2=100×50×25-10×15265×35×60×40≈22.16>10.828,
所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.
10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是(  )
A.直线l1和直线l2有交点(s,t)
B.直线l1和直线l2相交,但交点未必是点(s,t)
C.直线l1和直线l2由于斜率相等,所以必定平行
D.直线l1和直线l2必定重合
解析:选A l1与l2都过样本中心(x,y).
11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:
 y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为(  )
A.a=9,b=8,c=7,d=6
B.a=9,b=7,c=6,d=8
C.a=8,b=6,c=9,d=7
D.a=6,b=7,c=8,d=9
解析:选B 对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad-bc|越大, 故检验知选B.
12.两个分类变量X和Y, 值域分别为{x1,x2}和{y1,y2}, 其样本频数分别是a=10, b=21, c+d=35. 若X与Y有关系的可信程度不小于97.5%, 则c等于(  )
A.3   B.4
C.5   D.6
解析:选A 列2×2列联表如下:
 x1 x2 总计
y1 10 21 31
y2 c d 35
总计 10+c 21+d 66
故K2的观测值k=66×[1035-c-21c]231×35×10+c56-c≥5.024. 把选项A, B, C, D代入验证可知选A.
二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)
13.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y^=0.01x+0.5,则加工600个零件大约需要________h.
解析:当x=600时,y^=0.01×600+0.5=6.5.
答案:6.5
14.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2为________.
解析:ei恒为0,说明随机误差总为0,于是yi=y^,故R2=1.
答案:1
15.下列是关于出生男婴与女婴调查的列联表
 晚上 白天 总计
男婴 45 A B
女婴 E 35 C
总计 98 D 180

那么A=______,B=______,C______,D=________,E=________.
解析:∵45+E=98,∴E=53,
∵E+35=C,∴C=88,∵98+D=180,∴D=82,
∵A+35=D,∴A=47,∵45+A=B,∴B=92.
答案:47 92 88 82 53
16.已知x,y之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=13x+1与l2:y=12x+12,利用最小二乘法判断拟合程度更好的直线是________.
x 1 3 6 7 8
y 1 2 3 4 5

解析:用y=13x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=1-432+(2-2)2+(3-3)2+4-1032+5-1132=73.用y=12x+12作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+3-722+(4-4)2+5-922=12.
因为S2<S1,故用直线l2:y=12x+12,拟合程度更好.
答案:y=12x+12
三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)
 焦虑 说谎 懒惰 总计
女生 5 10 15 30
男生 20 10 50 80
总计 25 20 65 110

试说明在这三种心理障碍中哪一种与性别关系最大?
解:对于上述三种心理障碍分别构造三个随机变量K21,K22,K23,由表中数据可得
K21=110×5×60-25×20230×80×25×85≈0.863,
K22=110×10×70-20×10230×80×20×90≈6.366,
K23=110×15×30-15×50230×80×65×45≈1.410.
因为K22的值最大,所以说谎与性别关系最大.
18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x和这一年各城市患白血病的儿童数量y,其数据如下表所示:
人均GDP x/万元 10 8 6 4 3 1
患白血病的儿童数量y/人 351 312 207 175 132 180

(1)画出散点图,并判断是否线性相关;
(2)求y与x之间的回归方程.
解:(1)作散点图(如下图所示).
 
由散点图可知y与x具有线性相关关系.
(2)将数据代入公式,可得b^≈23.253,a^≈102.151.
故y与x之间的线性回归方程是y^=23.253x+102.151.
19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):
 80及80分以上 80分以下 总计
试验班 35 15 50
对照班 20 m 50
总计 55 45 n

(1)求m,n;
(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系?
解:(1)m=45-15=30,n=50+50=100.
(2)由表中的数据,得K2的观测值为
k=100×35×30-15×20250×50×55×45≈9.091.
因为9.091>7.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.
20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:
 
(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?
 甲工艺 乙工艺 总计
一等品   
非一等品   
总计   

附:
P(K2≥k0) 0.10 0.05 0.01
k0 2.706 3.841 6.635

K2=nad-bc2a+bc+da+cb+d
(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.
解:(1)2×2列联表如下
 甲工艺 乙工艺 总计
一等品 50 60 110
非一等品 50 40 90
总计 100 100 200

K2=200×50×40-60×502110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.
(2)由题知运用甲工艺生产单件产品的利润X的分布列为
X 30 20 15
P 0.5 0.3 0.2

X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.
乙工艺生产单件产品的利润Y的分布列为
Y 30 20 15
P 0.6 0.1 0.3

Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,
Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.
由上述结果可以看出D(X)<D(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后选择甲工艺.
21.(本小题满分12分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者 男 女
需要 40 30
不需要 160 270

P(K2≥k0) 0.05 0.01 0.001
k0 3.841 6.635 10.828

附:K2的观测值k=nad-bc2a+bc+da+cb+d.
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?请说明理由.
解:(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为70500=14%.
(2)随机变量K2的观测值
k=500×40×270-30×1602200×300×70×430≈9.967.
由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关.
(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并且采用分层抽样方法比采用简单随机抽样的方法更好.
22.(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:
等级得分 (0,1] (1,2] (2, 3] (3,4] (4,5] (5,6]
人数 3 17 30 30 17 3

(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.
(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:
①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1);
②若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)范围内的人数.
(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:
x(数学学习能力) 2 3 4 5 6
y(物理学习能力) 1.5 3 4.5 5 6

 
①请画出上表数据的散点图;
②请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^(附参考数据:129≈11.4).
解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为C120×C180C2100=3299.
(2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,
标准差σ=[(0.5-3)2×0.03+(1.5-3)2×0.17+(2.5-3)2×0.3+(3.5-3)2×0.3+(4.5-3)2×0.17+(5.5-3)2×0.03]12=1.29≈1.1,
②由于μ=3,σ=1.1
当x∈(1.9,4.1)时,即x∈(μ-σ,μ+σ),
故数理学习能力等级分数在(1.9,4.1)范围中的概率为0.682 6.
数理习能力等级分数在(1.9,4.1)范围中的学生的人数约为10 000×0.682 6=6 826人.
(3)①数据的散点图如图:
 
②设线性回归方程为y^=b^x+a^,则
b^=i=15xiyi-5x yi=15x2i-5x2=1.1,a^=y-b^x=-0.4.
故回归直线方程为y^=1.1x-0.4.

文 章来源
莲山 课件 w w w.5Y k J.C om
最新试题

点击排行

推荐试题

| 触屏站| 加入收藏 | 版权申明 | 联系我们 |