平均绝对误差,标准偏差和平均值的标准偏差有什么区别??
4 个回答
水平不够,忘见谅。
1,平均绝对误差:
MAE=MAE=\frac{1}{n}\sum_{i=1}^{n}{\left| f_{i} -y_{i} \right| } = \frac{1}{n}\sum_{i=1}^{n}{\left|e_{i}\right|}
f_{i}:预测值
y_{i}:真实值
e_{i}=\left|f_{i}-y_{i}\right| 绝对误差
因此MAE就是指你的预测值与真实值之间平均相差多大。关于这个地方,我建议你看一下最小二乘法。他的理论依据就是去寻找最小的S_{E}^2=\sum_{i=1}^{n}{e_{i}^2},随后又将其分解为两部分:S_{T}^2=\sum_{i=1}^{n}{(y_{i}-\bar{y})^2} 反应了Y的观测值的总离差
S_{R}^2=\sum_{i=1}^{n}{(f_{i}-\bar{y})^2} 反映了Y的预测值的总离差(也就是回归直线引起的部分)
从而你要判断你的回归是否能接受。
R检验法
通过计算r^2=\frac{S_{R}^2}{S_{T}^2}是否落在拒绝域K_{0}=\{\left|r\right|>r_\alpha (n-2)\}内进行判断。(H_{0}:Y与X线性无关;H_{1}:Y与X线性相关)
同样的还有F检验法,t检验法。
从而就会要求用到样本方差,样本均值的分布。而这就是你问的下面的Standard error of sample的用处。
2.1,标准偏差(Standard deviation)
\bullet 连续型随机变量
\sigma =\sqrt{var} =\sqrt{\int_{x}(x-\mu)^{2}dx }
x_{i} :随机变量值
\mu=\int_{x}xp(x)dx:随机变量均值
\bullet 离散型随机变量
\sigma =\sum_{i=1}^{N}{p_{i}(x_{i}-\mu)^2}
\mu=\frac{1}{N}\sum_{i=1}^{N}{x_{i}}
p_{i} :X取值x_{i}的概率
因此,标准偏差就是描述在均值周围的波动情况。\sigma 大则表示你的分布范围广且散;\sigma 小则表示你的分布范围窄且聚集。(以上都是在均值一定的情况下的讨论)
如下图(正态分布N(10,\sigma ^{2} )):
2.2 标准误(Standard Error)
S=\sqrt{ {\frac{1}{n-1}\sum_{i=1}^{n}{(x_{i}-\bar{x})^2}}}
\bar{x}=\frac{1}{n}\sum_{i=1}^{n}{x_{i}}
其中x_{i}为样本值
S就是当你在\sigma ^2未知时用来替代的。因为他具有无偏性。
3,平均值的标准偏差(Standard deviation of mean)
\sigma _{mean}=\frac{1}{\sqrt{n}}\sigma
这个变量是用来表示一组独立同分布的随机变量的均值的波动性,也就是均值的精确度。这个在只知道样本值的情况之下比较好理解些,当你已知一个样本集合的时候。你通过计算,可以得到很多的样本均值。但是,这个时候,你并不知道真实的总体均值是多少。从而你就可以利用SEOM进行简单的预测。当然,随后的具体是否接受,你还可以用区间估计或者假设检验去进行判断。
同样的,当\sigma 未知的时候。我们自然也就要用S来替代。
从而Standard error of mean
SE_{\bar{x}}=\frac{1}{\sqrt{n}}S
首先了解一下中心极限定理(以下都会用一些通俗的语句和图来解释):
样本平均值呈正态分布,即不论你样本所来自的这个群里属于什么分布,你反复从这个样本抽取出来所得到的平均值是呈正态分布的。注意⚠️这里有一个前提,就是你抽取的样本数量是大于等于30的。
举个例子:参加马拉松跑步的人要去现场需要坐车,所有人随机分了50车,每车60人,我们抽取1号车(假设我们给车排序1-50)50人的平均体重是Xbar1,已知参加马拉松所有人3000人(50*60)体重平均值是\mu,3000人的标准差(一定是整个群里3000人的)是s,则你可以放心的告诉别人这个Xbar1 99.7%的概率是在 \mu\pm3*s/\sqrt{50} 内。
所以现在来讲标准差和标准误差的关系——标准误差是被用来衡量样本平均值的离散性,标准差是衡量群里中所有个体的离散性,即标准误差是所有样本的平均值的标准差。
标准误差公式: SE=s/\sqrt{n} -再次注意s是这个群体整体的标准差,n是你反复要抽取的样本数量,每次抽取数量要大于等于30,即n>=30。
补充平均绝对百分比误差MAPE=sum[ |fi-yi|*100 / y ] /n
通过视频介绍平均绝对误差,让大家能快速理解和学习