试题提示:本试题仅供参考,如需真题原题请联系研究生院。
一、考试科目题型与分值
本试卷满分 150 分,考试时长 180 分钟,涵盖概率论、数理统计、多元统计分析三大板块,题型及分值分布如下:
- 证明题(共 2 题,每题 20 分,总计 40 分)
- 计算题(共 3 题,每题 25 分,总计 75 分)
- 分析题(共 1 题,每题 35 分,总计 35 分)
二、2025 年考研真题
(一)证明题(每题 20 分,共 40 分)
- 设随机变量 X 与 Y 相互独立,且均服从正态分布,X~N (μ₁,σ₁²),Y~N (μ₂,σ₂²)。证明:Z=aX+bY(a,b 为非零常数)服从正态分布,并求 Z 的期望与方差。
- 设 X₁,X₂,…,Xₙ为来自总体 X~U (0,θ) 的样本(θ>0),证明:θ 的矩估计量\(\hat{\theta}_1=2\bar{X}\)与最大似然估计量\(\hat{\theta}_2=\max(X₁,X₂,…,Xₙ)\)均为无偏估计量,并比较二者的有效性(即比较方差大小)。
(二)计算题(每题 25 分,共 75 分)
- 已知二维随机变量 (X,Y) 的联合概率密度函数为:
\(f(x,y)=\begin{cases}6xy^2, & 0<x<1,0<y<1 \\ 0, & \text{其他}\end{cases}\)
要求计算:
(1)X 与 Y 的边缘概率密度函数\(f_X(x)\)与\(f_Y(y)\),并判断 X 与 Y 是否独立(10 分);
(2)Cov (X,Y) 与相关系数 ρ_XY(8 分);
(3)P (X+Y<1)(7 分)。
- 设总体 X 的概率密度函数为\(f(x;\theta)=\begin{cases}\theta x^{\theta-1}, & 0<x<1,\theta>0 \\ 0, & \text{其他}\end{cases}\),X₁,X₂,…,Xₙ为样本。
(1)求 θ 的最大似然估计量\(\hat{\theta}_{ML}\)(12 分);
(2)验证\(\hat{\theta}_{ML}\)是否为相合估计量(13 分)。
- 某研究团队对 3 个地区的居民人均可支配收入(单位:万元)进行抽样调查,每个地区抽取 5 个样本,数据如下:
地区 A:3.2, 3.5, 3.6, 3.8, 4.0
地区 B:2.8, 3.0, 3.1, 3.3, 3.5
地区 C:2.5, 2.6, 2.7, 2.9, 3.0
(1)在显著性水平 α=0.05 下,检验 3 个地区居民人均可支配收入是否存在显著差异(F₀.₀₅(2,12)=3.89)(15 分);
(2)若存在差异,用 LSD 法进行多重比较(t₀.₀₂₅(12)=2.179)(10 分)。
(三)分析题(每题 35 分,共 35 分)
某电商平台收集 100 名用户的 3 项指标:日均浏览时长(X₁,单位:分钟)、月消费金额(X₂,单位:百元)、用户满意度评分(Y,单位:分,1-10 分),拟通过多元统计方法分析指标间关系。
(1)若要研究 X₁,X₂对 Y 的线性影响,应建立何种回归模型?说明模型的基本假设与参数估计方法(15 分);
(2)若发现 X₁与 X₂的相关系数为 0.85,会对回归分析产生何种影响?如何解决这一问题(10 分);
(3)若要综合 X₁,X₂评价用户 “活跃度”,再分析活跃度与 Y 的关系,可采用何种多元统计方法?简述分析步骤(10 分)。
三、参考答案
(一)证明题
- 证明:
- 独立正态变量的线性组合仍为正态分布:因 X,Y 独立且均服从正态分布,其特征函数分别为\(\phi_X(t)=e^{i\mu_1 t-\frac{1}{2}\sigma_1^2 t^2}\),\(\phi_Y(t)=e^{i\mu_2 t-\frac{1}{2}\sigma_2^2 t^2}\)(5 分);
- Z 的特征函数\(\phi_Z(t)=E(e^{it(aX+bY)})=E(e^{itaX})E(e^{itbY})=\phi_X(at)\phi_Y(bt)=e^{i(a\mu_1+b\mu_2)t-\frac{1}{2}(a^2\sigma_1^2+b^2\sigma_2^2)t^2}\),符合正态分布特征函数形式(10 分);
- 期望\(E(Z)=aE(X)+bE(Y)=a\mu_1+b\mu_2\),方差\(D(Z)=a^2D(X)+b^2D(Y)=a^2\sigma_1^2+b^2\sigma_2^2\)(5 分)。
- 证明:
- 无偏性:\(E(\hat{\theta}_1)=2E(\bar{X})=2×\frac{\theta}{2}=\theta\);\(E(\hat{\theta}_2)=\int_0^\theta x×\frac{nx^{n-1}}{\theta^n}dx=\frac{n}{\theta^n}×\frac{\theta^{n+1}}{n+1}=\frac{n}{n+1}\theta≠\theta\)(此处修正:原最大似然估计量\(\hat{\theta}_2=\max X_i\)为有偏估计,无偏修正量为\(\hat{\theta}_2'=\frac{n+1}{n}\max X_i\),\(E(\hat{\theta}_2')=\theta\))(10 分);
- 有效性:\(D(\hat{\theta}_1)=4×\frac{D(X)}{n}=4×\frac{\theta^2}{12n}=\frac{\theta^2}{3n}\);\(D(\hat{\theta}_2')=(\frac{n+1}{n})^2×[\frac{n\theta^2}{(n+2)(n+1)^2}]=\frac{\theta^2}{n(n+2)}\),当 n≥1 时,\(\frac{\theta^2}{n(n+2)}<\frac{\theta^2}{3n}\),故\(\hat{\theta}_2'\)更有效(10 分)。
(二)计算题
- (1)\(f_X(x)=\int_0^1 6xy^2dy=2x\)(0<x<1);\(f_Y(y)=\int_0^1 6xy^2dx=3y^2\)(0<y<1);因\(f(x,y)=f_X(x)f_Y(y)\),故 X 与 Y 独立(10 分);
(2)Cov (X,Y)=E (XY)-E (X) E (Y)=0(因独立),ρ_XY=0(8 分);
(3)\(P(X+Y<1)=\int_0^1\int_0^{1-x}6xy^2dydx=\int_0^1 2x(1-x)^3dx=\frac{1}{20}\)(7 分)。
- (1)似然函数\(L(\theta)=\prod_{i=1}^n \theta x_i^{\theta-1}=\theta^n (\prod_{i=1}^n x_i)^{\theta-1}\),取对数\(\ln L=n\ln\theta+(\theta-1)\sum\ln x_i\),求导得\(\hat{\theta}_{ML}=-\frac{n}{\sum\ln x_i}\)(12 分);
(2)由大数定律,\(\frac{1}{n}\sum\ln x_i\stackrel{P}{\to}E(\ln X)=-\frac{1}{\theta}\),故\(\hat{\theta}_{ML}\stackrel{P}{\to}\theta\),为相合估计(13 分)。
- (1)方差分析:总平方和 SST=1.86,组间平方和 SSA=1.58,组内平方和 SSE=0.28,F=SSA/(2)/SSE/(12)= (0.79)/(0.023)=34.35>3.89,拒绝原假设,存在显著差异(15 分);
(2)LSD=2.179×√(0.023×2/5)=0.23,地区 A 与 B、A 与 C 均值差均大于 0.23,差异显著;B 与 C 均值差 0.4<0.23,差异不显著(10 分)。
(三)分析题
- 建立多元线性回归模型\(\hat{Y}=\hat{\beta}_0+\hat{\beta}_1X_1+\hat{\beta}_2X_2\)(5 分);基本假设:线性性、误差项正态性、同方差、无自相关、自变量无多重共线性(5 分);参数估计用普通最小二乘法(OLS)(5 分)。
- X₁与 X₂高度相关(r=0.85),导致多重共线性,使参数估计量方差增大、显著性检验失效(5 分);解决方法:剔除其中一个变量、主成分回归、岭回归(5 分)。
- 采用主成分分析(PCA)(4 分);步骤:对 X₁,X₂标准化,计算协方差矩阵与特征值、特征向量,提取第一主成分作为 “活跃度” 指标,建立活跃度与 Y 的回归模型分析关系(6 分)。
四、辅导课程推荐
备考 805 统计学(学硕)时,若面临理论证明思路难梳理、多元统计方法应用不熟练、复杂计算易出错等问题,可选择新祥旭考研辅导课程。全科一对一辅导覆盖公共课与专业课,量身定制复习计划;专业课一对一辅导由目标院校学长学姐授课,聚焦理论推导、统计方法深度解读与综合分析能力提升。
报名即免费赠送历年真题及解析,助力精准把握命题规律。
如有该专业考研问题可以咨询 13671344286(微信同号),新祥旭考研咨询师将热情专业的解答您的考研问题。


















