【原创】R语言回归数据分析可视化案例报告 (附代码数据)

发布时间:

【原创】定制撰写数据分析可视化项目案例调研报告(附代码数据)有问题到淘宝找“大数据部落”就可以了
R语言回归数据分析可视化案例报告

使用R做回归分析整体上是比较常规的一类数据分析内容,下面我们具体的了解用R语言做回归分析的过程。首先,我们先构造一个分析的数据集
x<-data.frame(y=c(102,115,124,135,148,156,162,176,183,195,var1=runif(10,min=1,max=50,var2=runif(10,min=100,max=200,
var3=c(235,321,412,511,654,745,821,932,1020,1123
接下来,我们进行简单的一元回归分析,选择y作为因变量,var1作为自变量。
一元线性回归的简单原理:假设有关系y=c+bx+e,其中c+bxyx变化的部分,e是随机误差。可以很容易的用函lm(求出回归参数b,c并作相应的假设检验。
model<-lm(y~var1,data=xsummary(model
Call:
lm(formula=x$y~x$var1+1Residuals:
Min1QMedian3QMax
-47.630-18.654-3.08921.88952.326Coefficients:
EstimateStd.ErrortvaluePr(>|t|
(Intercept168.445315.281211.0231.96e-09x$var1-0.49470.4747-1.0420.311---
Signif.codes:0‘’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:30.98on18degreesoffreedomMultipleR-squared:0.05692,AdjustedR-squared:0.004525F-statistic:1.086on1and18DF,p-value:0.3111
从回归的结果来看,p值为0.311,变量var1不不显著,正常情况下p值小于0.05则认为有高的显著性水平。另外,R方位0.05692距离1太远,说明两者之间不存在相关性。我们进一步也对,yvar3做线性回归分析
model<-lm(y~var3,data=xsummary(model
Call:
lm(formula=y~var3,data=x

【原创】定制撰写数据分析可视化项目案例调研报告(附代码数据)有问题到淘宝找“大数据部落”就可以了
Residuals:
Min1QMedian3QMax
-3.0805-0.90800.65661.02552.1451Coefficients:
EstimateStd.ErrortvaluePr(>|t|
(Intercept81.4319901.39944258.198.45e-12var30.1006320.00190252.921.80e-11---
Signif.codes:0‘’0.001‘’0.01‘’0.05‘.’0.1‘’1Residualstandarderror:1.73on8degreesoffreedomMultipleR-squared:0.9972,AdjustedR-squared:0.9968F-statistic:2801on1and8DF,p-value:1.802e-11
从结果来看,常数项和var3的显著性水平都非常理想,同事R方达到0.99,整个模型的拟合度很高,可以说明两者间存在强的线性相关。
接下来,我们可以利用这个模型做些预测
pre<-data.frame(var3=c(56,36predict(model,pre,interval="prediction",level=0.95
fitlwrupr
187.0673782.0749192.05983285.0547480.0138790.09560以上是预测结果
接下来,我们进一步了解下多元线性回归,多元线性回归是在y与多个自变量之间建立模型,寻找他们之间的线性关系。在多元回归分析过程中,由于我们不知道因变量和那几个自变量之间存在线性关系,如果一个一个的检验,整个过程将变得非常繁琐。
好在R中有自动进行逐步回归的函数,我们只要根据函数运行结果,选择合适模型,并检验各项参数就可以了。接下来,看下具体的步骤,还是以之前的数据集作为分析样本,我们来了解下,如何进行逐步回归分析
model<-lm(y~.,data=xsummary(model
Call:
lm(formula=y~.,data=xResiduals:
Min1QMedian3QMax
-2.6684-1.08310.51141.11582.3292Coefficients:
EstimateStd.ErrortvaluePr(>|t|
(Intercept83.6201095.04750316.5673.08e-06var1-0.0289060.057383-0.5040.632

【原创】R语言回归数据分析可视化案例报告 (附代码数据)

相关推荐