目录
一、竞赛赛题
二、问题(1)分析
三、问题(2)分析
四、多元线性回归分析(Stata)
1.多元自变量的选定
(1)乙醇转化率
(2)C4烯烃选择性
2.定量变量的描述性统计(Stata)
3.异方差检验
(1)散点图检验?
(2)BP检验(怀特检验的特例)
(3)怀特检验(使用范围广,优先考虑)
4.多重共线性检验(方差膨胀因子:VIF)
5.向后逐步回归
(1)乙醇转化率
(2)C4烯烃选择性
一、竞赛赛题
二、问题(1)分析
CUMCM 2021-B:乙醇偶合制备C4烯烃(1)_Destiny坠明的博客-CSDN博客
三、问题(2)分析
CUMCM 2021-B:乙醇偶合制备C4烯烃(2)_Destiny坠明的博客-CSDN博客
四、多元线性回归分析(Stata) 1.多元自变量的选定 (1)乙醇转化率
? ? ? ? 由问题(1)拟合结果可知,乙醇转化率y与温度T呈Logistic阻滞增长关系,故需要将温度T做形式变换后加入到多元线性回归模型中。
????????根据问题(1)的阻滞增长模型的拟合结果,r的波动较小,均值为0.0265,其分布散点图如下:
?????????y0在经过剔除离群值的处理之后,也稳定在一个区间内,均值为0.0386,其分布散点图如下:
????????将原式第二项分母中的y0与r用其均值近似代替,并引入β作为补偿系数,可知β≈1.1;再将系数全部移入第一项中,即第一项整体视为多元回归系数β'。
? ? ? ? 综上,乙醇转化率(Y1)的多元自变量(X)为:
?
(2)C4烯烃选择性
????????由问题(1)拟合结果可知,C4烯烃选择性y与温度T呈二次多项式关系,故需要将温度T做形式变换后加入到多元线性回归模型中。
?? ? ? ? 综上,C4烯烃选择性(Y2)的多元自变量(X)为:
2.定量变量的描述性统计(Stata) // 导入数据 import excel "C:\Users\熊锐成\Desktop\XY.xlsx", sheet("XY") firstrow
<XY.xlsx>
3.异方差检验
(1)散点图检验?
①残差-拟合值散点图(乙醇转化率)
// OLS回归(乙醇转化率) regress 乙醇转化率 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 指数型温度 二次项温度 温度 // 残差与拟合值的散点图 rvfplot // 残差与自变量x的散点图 //rvpplot x? ? ? ? 当拟合值处在不同的区间范围内,残差的变化程度差别较大,存在异方差现象。
②残差-拟合值散点图(C4烯烃选择性)
// OLS回归(C4烯烃选择性) regress C4烯烃选择性 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 二次项温度 温度 // 残差与拟合值的散点图 rvfplot?? ? ? ? 当拟合值处在不同的区间范围内,残差的变化程度差别较大,存在异方差现象。
(2)BP检验(怀特检验的特例)
①乙醇转化率
// OLS回归(乙醇转化率) regress 乙醇转化率 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 指数型温度 二次项温度 温度 // BP检验 estat hettest ,rhs iid? ? ? ? ?P值小于0.05,说明在95%的置信水平下拒绝原假设,即我们认为乙醇转化率的多元线性回归模型的扰动项存在异方差。
②C4烯烃选择性
// OLS回归(C4烯烃选择性) regress C4烯烃选择性 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 二次项温度 温度 // BP检验 estat hettest ,rhs iid? ? ? ? ?P值小于0.05,说明在95%的置信水平下拒绝原假设,即我们认为C4烯烃选择性的多元线性回归模型的扰动项存在异方差。
(3)怀特检验(使用范围广,优先考虑)
①乙醇转化率
// OLS回归(乙醇转化率) regress 乙醇转化率 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 指数型温度 二次项温度 温度 // 怀特检验 estat imtest,white?? ? ? ? ?P值小于0.05,说明在95%的置信水平下拒绝原假设,即我们认为乙醇转化率的多元线性回归模型的扰动项存在异方差。
②C4烯烃选择性
// OLS回归(C4烯烃选择性) regress C4烯烃选择性 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 二次项温度 温度 // 怀特检验 estat imtest,white??? ? ? ? ?P值小于0.05,说明在95%的置信水平下拒绝原假设,即我们认为C4烯烃选择性的多元线性回归模型的扰动项存在异方差。
? ? ? ? ?由于原始数据的异方差扰动严重,我们使用OLS+稳健的标准误作为指标,以防止异方差影响假设检验的计算。
4.多重共线性检验(方差膨胀因子:VIF)
①乙醇转化率
// OLS回归(乙醇转化率) regress 乙醇转化率 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 指数型温度 二次项温度 温度 // VIF检验 estat vif? ? ? ? ?乙醇转化率的多元线性回归模型的平均VIF为200.93,远大于VIF最小经验值,故其存在多重共线性的问题。
②C4烯烃选择性
// OLS回归(C4烯烃选择性) regress C4烯烃选择性 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 二次项温度 温度 // VIF检验 estat vif?? ? ? ? ?C4烯烃选择性的多元线性回归模型的平均VIF为116.68,远大于VIF最小经验值,故其存在多重共线性的问题。
? ? ? ? ?此处我们将采用逐步回归的方法解决多重共线性的问题,以变量显著性为依据,不断筛选自变量,从而构建出最适的多元回归模型。
5.向后逐步回归 (1)乙醇转化率 // 向后逐步回归(乙醇转化率) stepwise regress 乙醇转化率 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 指数型温度 二次项温度 温度 , r pr(0.05)
①设定显著性水平为0.05,使用OLS+稳健的标准误作为指标,向后逐步回归得到多变量回归结果:
②进一步引入乙醇浓度与温度的交叉项,设定显著性水平为0.05,使用OLS+稳健的标准误作为指标,再次向后逐步回归:
// 添加 温度-乙醇 交叉项 stepwise regress 乙醇转化率 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 指数型温度 二次项温度 温度 温度乘乙醇浓度 , r pr(0.05)? ? ? ? ?加入乙醇浓度与温度的交叉项之后,拟合优度提高,显著因素增多,模型的泛化能力更强。
(2)C4烯烃选择性 // 向后逐步回归(C4烯烃选择性) stepwise regress C4烯烃选择性 M1 Co负载量wt CoSiO2mg HAPmg CoSiO2和HAP装料比mgmg 乙醇浓度mlmin 二次项温度 温度 , r pr(0.05)
设定显著性水平为0.05,使用OLS+稳健的标准误作为指标,向后逐步回归得到多变量回归结果:
?
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,会注明原创字样,如未注明都非原创,如有侵权请联系删除!;3.作者投稿可能会经我们编辑修改或补充;4.本站不提供任何储存功能只提供收集或者投稿人的网盘链接。 |