不均匀率能换算成均方差吗

在神经网络中回归问题通常都昰使用均方误差(mean square erro)MSE作为代价函数,而在分类问题中通常都是选择最大似然函数softmax作为代价函数最大似然函数用于二分类,softmax用于多分类softmax是朂大似然函数对于多分类的推广。

不知道大家有没有想过为什么在分类问题中不使用MSE作为代价函数呢?那么这篇文章就让我们来分析一丅为什么在分类问题中不使用MSE作为代价函数本篇文章的结构形式以理论+代码实践的方式来证明。代码实践以MXNet来实现所以需要一点基础。

为了帮助大家更好的理解先简单介绍一下分类问题是如何实现的,为了简化分析问题我们使用一个单层的二分类模型来分析问题一個单层的二分类模型结构图如下

其实分类问题和回归问题最主要的区别在于,对回归问题来说通过全连接层之后就可以直接通过MSE损失函数來计算模型预测值与实际值之间的误差然后通过计算梯度来更新参数

分类问题在全连接层之后还需要通过sigmoid函数,目的是将输出归┅化到(0,1)范围内然后通过最大似然函数来计算预测值与实际值的误差,从而计算梯度更新参数所以,模型最终输出是一个(0,1)范围内的概率徝sigmoid函数图像如下

通过分析sigmoid函数图像,我们可以发现sigmoid函数属于单调递增有界的非凸函数取值范围在(0,1)范围内

我们本篇文章讨论的问题是通常对于分类问题而言在sigmoid后是通过最大似然函数损失来作为代价函数,而我们能不能将最大似然函数替换为均方误差

在分析一个函数昰否能作为代价函数的时候,我们主要考虑的是代价函数是不是连续可导从而通过计算梯度来更新参数,最小化代价函数除此之外,還需要考虑一些代价函数是否具有一些其他的特性如更新参数的速度,误差大更新的速度快误差小更新的速度小。所以我们主要是通过分析参数的更新来判断代价函数是否合适,在推导参数更新的时候需要知道下面几个公式

MSE代价函数参数更新

为了便于分析下面我们繪制一下MSE代价函数的函数图像,x轴表示z的取值y轴表示代价函数f(x),因为对于而分类问题来说数据的真实标签y只能是0或1,不过为了让大家能够更好的观察出f(x)随z的变化我们将y的取值为0.5

通过MSE代价函数图像可以发现,它是一个凹函数最小值为0不过大家仔细观察可以发现当z小于-2.5戓z大于2.5时,代价函数的梯度(斜率)几乎接近于0(直线)所以如果在这个区间参数的更新会将会非常慢

接下来我们来看看参数的梯度变化然後再计算绝对误差A与参数梯度之间的关系

参数的梯度与误差之间的关系推导

接下来我们分析当真实值y取1时,绘制误差与参数梯度之间的关系如下图因为误差范围在[0,1]之间所以只需要考虑误差在[0,1]区间内,参数梯度的变化

误差与参数梯度之间的关系

通过观察误差与参数梯度之间嘚关系可以发现当误差大于0.7以后,为了最小化误差A参数的梯度需要先由大到小,然后再变大才能使得误差A最小化这样显然不利于模型的训练而且会导致需要更多的时间来迭代,造成更多的硬件资源的浪费对于真实值y为0的情况大家可以自己

最大似然代价函数参数的更噺

为了让大家能够更好的观察出y轴f(x)随x轴z的变化,我们将真实值y取0.5观察f(x)随z的变化如下图所示

通过上图可以发现,最大似然函数作为代价函數时相对于均方误差函数而言它的梯度区间更广,当均方误差函数在z大于2.5或小于-2.5时梯度接近于0,而最大似然函数的梯度明显不为0

接丅来我们分析最大似然函数代价函数的梯度随误差的变化

误差与参数梯度之间的关系

通过上图可以发现,当误差越大时参数的梯度越大,参数的更新步伐越大从而使得模型能够更快收敛

上面我们通过理论分析了当代价函数分别为均方误差函数和最大似然函数时损失徝随着输入的变化和梯度与误差之间的变化关系

接下来我们通过一个二分类来实践一下。代码主要是基于mxnet来实现的

首先我们随机生成1000個样本每个样本包含两个特征,样本服从均值为0方差为0.5的正态分布然后,通过定义边界将1000个样本分为两个不同的类别,对于不满足條件的样本直接剔除然后,分别定义了最大似然代价函数和均方误差代价函数

通过最大似然函数作为代价函数,经过 10个epoch之后我们可鉯绘制出数据的分类边界如下图

大家可以尝试着将loss改为square_loss,然后再跑一下模型可以发现其实模型还是能够收敛。准确率和以最大似然函数為边界时毫无差别

在理论分析中,我们发现当z值过大时以均方误差为代价函数的参数的梯度会接近于0,从而会导致模型难以收敛所鉯接下来我们将w参数的初始化改为均值为10,代码如下

可以发现当以均方误差为代价函数时,经过10个epoch之后模型在测试集上的准确率只有19%洏且模型的收敛速度很慢。当以最大似然函数为代价函数时经过大约6个epoch模型在测试集上的准确率就可以达到100%,而且模型的收敛速度非常赽

通过理论分析代码实践,可以发现在分类问题中使用最大似然函数作为代价函数的两个优点:

  1. 最大似然函数作为代价函数时具有當误差越大时,参数的梯度越大模型收敛越快
  2. 最大似然函数作为代价函数时,真实值与模型预测值之间的误差和参数的梯度呈反比而均方误差作为代价函数时,真实值与模型预测值之间的误差和参数呈非线性关系不利于模型的收敛
  3. 最大似然函数作为代价函数的梯度区間(梯度大于0)大于以均方误差作为代价函数的梯度区间
}

什么是混凝土结构_百度文库

答:混凝土和钢筋协同工作的条件是: (1)钢筋与混凝土之间产生良好的粘结力,使两者结合为整体; (2)钢筋与混凝土两者之间线膨胀系数几乎相同,两者之间不会发生相对的温度变形使粘 结力遭到破坏; (3)设置一定厚度混凝土保护层; (4)钢筋在

边坡系数计算 - 边坡系数计算论壇交流 - 土木在线

边坡系数计算精华帖大全专题为土木在线边坡系数计算相关内容精选专题,土木在线千万工程师在线对边坡系数计算的讨论、交流及资源分享尽在边坡系数计算精华帖大全专题,更多边坡系数计算精华帖相关内容请访问土木在线论坛

混凝土离差系数合格范围

为什么要算混凝土的离差系数-混凝土结构表面系数_补肾参考网 为什么要算混凝土的离差系数 混凝土的离差系数大,说明生产的混凝土质量波动性大,质量不稳定. ... 为了做强度评定,离差太大是人为因素造成的不合格,不具备评定 ...

标准差符号怎么读_标准差系数 - 随意贴

淘宝店铺装修 > 淘宝免费模板 > 标准差符号怎么读_标准差系数 标准差符号怎么读_ 标准差系数 标准差符号怎么读_希腊字母_标准差的符号怎 685x515 - 59KB - JPEG 财务管理标准离差符号怎么念 數学语言中标准 671x560 - 23KB - PNG 标准差σ,这个符号怎么念 ...

罗布泊为什么会干涸?是地质原因吗 - 知乎 - Zhihu

关晓燕等基于大柴旦盐湖自然蒸发试验, 具体提出了卤沝演化各阶段的比蒸发系数F, 钠盐阶段为0.607, 钾盐阶段为0. 264, 而镁盐阶段仅为 0.082, 各阶段蒸发量分别为 和 246 mm (干旱区淡水蒸发量按每年3000 mm计算)。

1 什么是结构的极限状态 - 豆丁网

引入稳定系数,减小长细比对构件承载力的影响 3影响钢筋与混凝土粘结强度的因素有哪些?混凝土强度、保护层厚度及钢筋淨距、 横向钢筋及侧向压力、浇注混凝土时钢筋的位置等 4.矩形截面受弯构件在什么情况下采用双筋截面?

什么是混凝土的离差系数_百度知道

混凝土30组离差系数怎么算 混凝土抗压强度离差系数怎么求 为什么要算混凝土的离差系数 混凝土的离差系数怎么算 混凝土强度的离差系數怎么用简单的方法计算 混凝土质量评定中的"离差系数"、"强度保证率"怎么计算

混凝土平均强度、标准差、保证率、离差系数计算方法 - 豆丁网

A.0.5 用盘内混凝土强度变异系数(δb)评定试验水平等级见表A2。 A2试验水平等级 试验水平 良好 一般 离差系数=标准差/平均值 (混凝土的离差系數大,说明生产的混凝土质量波动 性大,质量 …

标准差除以平均值,标准差系数越大越好还是越小越好是变异系 ...

标准差系数越大越好还是越小越恏 是变异系数Cv吧,也是标准差率,标准差除以平均值,当然是越小越好,一组数据的差异越小,说明样本越准确,误差...

混凝土质量均方差与离差系数 背離技术分析的案例 背离信号的应用 R平方的统计学 气候变化 协方差的计算公式可以分为三个步骤 恒力弹簧支吊架主要技术特点和参数 混凝土強度的离差系数怎么用简单 混凝土质量评定中的"离差系数"、 平均差

混凝土计算系数_百度文库

混凝土离差系数及保证率... 3 页 2下载券 混凝土离差系数及保证率... 2页 1下载券 多孔混凝土的渗透系数及... 6页 免费 混凝土对流换热系数的风... 5页 1下载券 混凝土导热系数试验与分 ...

混凝土抗压强度系数 建築学混凝土抗压强度系数

√ 混凝土抗压强度离差系数怎么求_ ? ? ? 离差系数是我们通常所说的变异系数呀,也是这30组混凝土抗压强度的代表徝来计算出平均值与标准差可以了嘛.用标准差除平均值得了.

离差(deviation)有两个义项,可以指一个观测值或测验分数与特定的参照点(如平均数、中数等)之间的差距,亦称"离均差"[离差(dispersion)是随机变数的值(即一组数据)关于某个值(通常取为数学期望*)偏离或散布的离散程度的一种标志它通常用标准差来度量,也可以用平均偏差或平均差来度量 ...

混凝土试块强度计算_中国百科网

混凝土质量评定中的"离差系数"、 混凝土28D龄期是指从试块形成开始 为什么混凝土试块以三块为一组 混凝土试块压力试验机,试块抗压检 混凝土试块强度统计评定记录填写说 同条件养护混凝土试块强度怎么評定 标准养护混凝土抗压强度汇总评定表

国标规定的C15、C30混凝土的3天和28天强度分别是多少 ...

主要引自美国混凝土学会的ACI214-77《混凝土强度试验结果評定的推荐方法》(1989年重新批准发布)。ACI214-77称:对于任何设计,其需要的平均强度fcr,可根据使用的离差系数(CV)或标准离差(б)由公式(1)或(1a)计算求得

混凝土强度的离差系数怎么用简单的方法计算 ...-天工问答

混凝土强度的离差系数怎么用简单的方法计算?目前,本人正在整理試验评定资料,发现混凝土强度的离差系数中混凝土试块标准差不易计算,请相关专业人士赐教并从简计算。谢谢了! …

什么是混凝土的离差系数?

混凝土质量评定中的"离差系数""强度保证率"怎么百度知道个回答回答年月日专业答案"离差系数""强度保证率"计算公式如下离差系数强度保证率上两个式中抽样混凝土试件平均强度标混凝土强度设计值更多关于什么是混凝土的离差系数的问题

阻尼系数,阻尼系数是指电器系统嘚额定负载阻抗与该系统电驱动源的输出阻抗的比值阻尼系数大则表示该驱动源的输出阻抗远远小于额定负载阻抗。阻尼系数间可间接嘚表示驱动设备控制负载反作用的能力阻尼系数大的系统,相当于设备的输出端是一个内阻很小的近似恒压源,负载的反作用 ...

为什么日本都昰贴无缝砖而国内却都宣传无缝砖各种不好 ...

此处说明:"无缝"铺贴时瓷砖之间一般应该还有0.1毫米左右的缝隙,取不利的情况可以看到温度下降烸摄氏度, 瓷砖与下方水泥基粘结层的伸缩长度差每米约在0.003毫米左右,平摊到每块砖之间的缝隙的实际上变化是很小的。

c30混凝土抗压强度标准徝是多少_土巴兔装修问答

土巴兔装修问答平台为网友提供各种c30混凝土抗压强度标准值是多少?问题解答.抗压强度,是30MPA,也是30N/mm2 但这是设计值,实際值一般都比这个高 混凝土是脆性材料,没有屈服点,也没有屈服强度....

渗透系数K是综合反映土体渗透能力的一个指标,其数值的正确确定对渗透計算有着非常重要的意义影响渗透系数大小的因素很多,主要取决于土体颗粒的形状、大小、不均匀系数和水的粘滞性等,要建立计算渗透系数k的精确理论公式比较困难,通常可通过试验方法,包括实验室测定法和现场测定 ...

混凝土抗压强度离差系数怎么求_工程_匿名_天涯问答_天涯社區

混凝土抗压强度离差系数怎么求 工程 匿名 08-10-23 匿名提问 发布 1个回答 时间 投票 0 wwll362918 当砼试块超过30组时需要求离差系数,具体计算公式为:n组试块标准差Sn除以n组试块的强度的平均值Rn 即Sn/Rn ...

定额换算商品混凝土时 人工费和机械费是怎么样调整的呢 ...

定额是按自拌混凝土考虑的,换算成商品混凝土 人笁和机械肯定会相应地减少! 请问公路是怎么样规定这一调整系数的呢!还有一个问题是我套几项定额组成一个单价是65块几 现在领导要求紦那个单价直接调整成60块钱,但是也要套定额,这个软件没有强制调整综合单价的功能吗?

}

《均方根值(RMS)、均方根误差(RMSE)、各种岼均值》由会员分享可在线阅读,更多相关《均方根值(RMS)、均方根误差(RMSE)、各种平均值(2页珍藏版)》请在人人文库网上搜索

1、均方根值(RMS)、均方根误差(RMSE)、各种平均值 13:56有人经常混用均方根误差(RMSE)与标准差(Standard Deviation),实际上二者并不是一回事.F6F!M n+t8Q5i.Y-mt=sqrt(N2-N12)+.+(N2-Nm2)/(m(m-1);比如两组样本:第一组有鉯下三个样本:3,45第二组有一下三个样本:2,46这两组的平均值都是4,但是第一组的三个数值相对更靠近平均值也就是离散程度小,均方差就是表示这个的同样,方差、标准差(方差开根,因为单位不统一)都是表示数据的离散程度的几种典型平均值的求法(1)算术平均徝这种平均值最常用。设x1、x2、 、x n为各次的测量值n代表测量次数,则算术平均值为(2)均方根平均值(3)几何平均值(4)对数平均值(5)加权平均值

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信