单选题 (共 7 题 ),每题只有一个选项正确
为了解某高中学生的身高情况, 现采用分层抽样的方法从三个年级中抽取一个容量为 100 的样本, 其中高一年级抽取 24 人,高二年级抽取 26 人。若高三年级共有学生 600 人,则该校学生总人数为()
$\text{A.}$ 900
$\text{B.}$ 1200
$\text{C.}$ 1500
$\text{D.}$ 1800
已知x,y之间 一组数据

则 $y$ 与 $x$ 之间的线性回归方程 $\hat{y}=\hat{b} x+\hat{a}$ 必过点()
$\text{A.}$ $(2,2)$
$\text{B.}$ $(1.5,0)$
$\text{C.}$ $(1,2)$
$\text{D.}$ $(1.5,4)$
某人记录了自己一周内每天的运动时长 (单位: 分钟): $54,58,46,62,80,50, x$. 若这组数据的第 40 百分位数与第 20 百分位数的差为 3 , 则 $x$ 的值可能为 ( )
$\text{A.}$ 47
$\text{B.}$ 45
$\text{C.}$ 52
$\text{D.}$ 60
某学校校医研究温差 $x\left({ }^{\circ} \mathrm{C}\right)$ 与本校当天新增感冒人数 $y$ (人) 的关系, 该医生记录了 5 天的数据, 且样本中心点为 $(8,25)$. 由于保管不善, 记录的 5 天数据中有两个数据看不清楚, 现用 $m, n$ 代替, 已知 $18 \leqslant m \leqslant 24, \quad 26 \leqslant n \leqslant 34$, 则下列结论正确的是
$\text{A.}$ 在 $m, n$ 确定的条件下, 去掉样本点 $(8,25)$, 则样本的相关系数 $r$ 增大
$\text{B.}$ 在 $m, n$ 确定的条件下, 经过拟合, 发现基本符合线性回归方程 $\hat{y}=2.6 x+\hat{a}$, 则 $\hat{a}=4$
$\text{C.}$ 在 $m, n$ 确定的条件下, 经过拟合, 发现基本符合线性回归方程 $\hat{y}=2.6 x+\hat{a}$, 则当 $x=12$ 时, 残差为 0.4
$\text{D.}$ 事件" $m=20, n=28$ " 发生的概率为 $\frac{1}{5}$
甲、乙、丙、丁四位同学组成的数学学习小组进行了一次小组竞赛,共测试了5道题,每位同学各题得分情况如下表:

下列说法正确的是()
$\text{A.}$ 甲的平均得分比丙的平均得分高
$\text{B.}$ 乙的得分极差比丁的得分极差大
$\text{C.}$ 对于这 4 位同学, 因为第 4 题的平均得分比第 2 题的平均得分高, 所以第 4 题相关知识一定比第 2 题相关知识掌握好
$\text{D.}$ 对于这 4 位同学, 第 3 题得分的方差比第 5 题得分的方差小
在发生某公共卫生事件期昍, 我国有天机构规足:该事件在一段时间没有发生规模群体感染的标志为"汼续 10 天每天新增加疑似病例不超过 7 人" . 根据过去 10 天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 ( )
$\text{A.}$ 甲地总体均值为 3 , 中位数为 4
$\text{B.}$ 乙地总体均值为 2 , 总体方差大于 0
$\text{C.}$ 丙地中位数为 3 , 众数为 3
$\text{D.}$ 丁地总体均值为 2 , 总体方差为 3
某中学共有 1000 人,其中男生 700 人,女生 300 人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于 4 小时),现在用分层抽样的方法从中收集 200 位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中, 有 40 位女生的每周平均体育锻炼时间超过 4 小时,根据独立性检验原理( )

$\text{A.}$ 有 $95 \%$ 的把握认为"该校学生每周平均体育锻炼时间与性别无关"
$\text{B.}$ 有 $90 \%$ 的把握认为"该校学生每周平均体育锻炼时间与性别有关"
$\text{C.}$ 有 $90 \%$ 的把握认为"该校学生每周平均体育锻炼时间与性别无关"
$\text{D.}$ 有 $95 \%$ 的把握认为"该校学生每周平均体育锻炼时间与性别有关"
多选题 (共 4 题 ),每题有多个选项正确
已知一组样本数据 $x_1, x_2, \mathrm{~L}, x_n$ 为不全相等的 $n$ 个正数, 其中 $n \geq 4$, 若由 $y_k=3 x_k-2(k=1,2, \mathrm{~L}, n)$ 生成一组新的数据 $y_1, y_2, \mathrm{~L}, y_n$, 则这组新数据与原数据中可能相等的量有 ( )
$\text{A.}$ 极差
$\text{B.}$ 平均数
$\text{C.}$ 中位数
$\text{D.}$ 标准差
某学校共有学生 1400 人, 其中男生 800 人, 女生 600 人, 学校为了了解学生参加知识竞赛的考试成绩, 采用分层抽样的方法从全校学生中抽取 70 人, 其中男生的平均成绩为 77 分, 方差为 123 , 女生的平均成绩为 70 分, 方差为 130 , 则下列正确的是 ( )
$\text{A.}$ 从男生中抽取 40 人
$\text{B.}$ 抽取的 70 人的平均成绩为 74 分
$\text{C.}$ 抽取的 70 人成绩的方差为 138
$\text{D.}$ 估计全体学生中每个男生的竞赛成绩均比每个女生的竞赛成绩多 7 分
下列说法错误的是()
$\text{A.}$ 当样本相关系数 $r$ 满足 $|r|=1$ 时, 成对样本数据的两个分量之间满足一种线性关系
$\text{B.}$ 残差等于预测值减去观测值
$\text{C.}$ 决定系数 $R^2$ 越大, 模型拟合效果越差
$\text{D.}$ 在独立性检验中,当 $\chi^2 \geq x_\alpha$ ( $x_\alpha$ 为 $\alpha$ 的临界值)时,推断零假设 $H_0$ 不成立
下列命题正确的是()
$\text{A.}$ 若样本数据 $x_1, x_2, \mathrm{~L}, x_6$ 的方差为 2 , 则数据 $2 x_1-1,2 x_2-1, \mathrm{~L}, 2 x_6-1$ 的方差为 7
$\text{B.}$ 若 $P(A)=0.6, P(B)=0.8, P(A \mid B)=0.5$, 则 $P(B \mid A)=\frac{2}{3}$.
$\text{C.}$ 在一组样本数据 $\left(x_1, y_1\right),\left(x_2, y_2\right), \mathrm{L},\left(x_n, y_n\right),\left(n \geq 2, x_1, x_2, \mathrm{~L}, x_n\right.$, 不全相等) 的散点图中, 若所有样本点 $\left(x_i, y_i\right)(i=1,2, \mathrm{~L}, n)$ 都在直线 $y=-\frac{1}{2} x+1$ 上, 则这组样本数据的线性相关系数为 $-\frac{1}{2}$
$\text{D.}$ 以模型 $y=c \mathrm{e}^{k x}$ 去拟合一组数据时, 为了求出经验回归方程, 设 $z=\ln y$, 求得线性回归方程为 $\hat{z}=4 x+0.3$, 则 $c, k$ 的值分别是 $\mathrm{e}^{0.3}$ 和 4
填空题 (共 2 题 ),请把答案直接填写在答题纸上
"幸福感指数" 是指某个人主观地评价他对自己目前生活状态的满意程度的指标. 常用区间 $[0,10]$ 内的一个数来表示,该数越接近 10 表示满意度越高。甲、乙两位同学分别随机抽取 10 位本地市民调查他们的幸福感指数,甲得到十位市民的幸福感指数为 $5,6,6,7,7,7,7,8,8,9$ ,乙得到十位市民的幸福感指数的平均数为 8 . 方差为 2.2 , 则这 20 位市民幸福感指数的方差为
我国为全面建设社会主义现代化国家,制定了从 2021 年到 2025 年的 "十四五" 规划. 某企业为响应国家号召, 汇聚科研力量, 加强科技创新, 准备增加研发资金. 现该企业为了了解年研发资金投入额 $x$ (单位:亿元)对年盈利额 $y$ (单位:亿元)的影响,研究了 "十二五" 和 "十三五" 规划发展期间近 10 年年研发资金投入额 $x_i$ 和年盈利额 $y_i$ 的数据. 通过对比分析, 建立了两个函数模型: (1) $y=\alpha+\beta x^2$, (2) $y=e^{i x+t}$,其中 $\alpha, \beta, \lambda, t$ 均为常数, $e$ 为自然对数的底数. 令 $u_i>x_i^2, v_i=\ln y_i(i=1,2, \cdots, 10)$, 经计算得如下数据:
请从相关系数的角度分析, 模型拟合程度更好是 $\qquad$ :利用模型拟合程度更好的模型以及表中数据,建立 $y$ 关于 $x$ 的回归方程为 $\qquad$ ;(系数精确到 0.01 )
附: (1) 相关系数 $r=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sqrt{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2 \sum_{i=1}^n\left(y_i-\bar{y}\right)^2}}$, 回归直线 $\hat{y}=\hat{a}+\hat{b} x$ 中: $\hat{b}=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)\left(y_i-\bar{y}\right)}{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}$, $\hat{a}=\bar{y}-\hat{b} \bar{x}$