使命召唤16 ,我朋友9600KF+2070S.我10700K+2080S按理说我比他高10~20帧数,然而他160我130这是为什么

摘要:全文约1800字建议阅读时间為7分钟。本文主要介绍了SVP方法作为一种用于深度学习的数据选择方法,其可以在保证识别准确率的同时有效地提高深度学习中的计算效率。例如在主动学习中,SVP的运行速度最多可提高到基础的41.9倍同时误差没有显著增加,这对于深度学习中提高模型训练速度来说是一個有效的方法


在许多任务中我们会面对海量的有效数据来训练深度网络,那么在实际的训练中我们怎样可以快速确定应该使用哪些数据呢类似于主动学习(active learning)和核心集选择(core-set selection)等方法是确定训练数据的有效手段,但是上述方法计算花销大且难以大规模使用

Coleman等人提出了一种将数據选择速度提高多达41.9倍的方法。他们使用一种规模较小、精度较差的模型作为规模较大的目标模型的简单替代模型并用此来选择用于训練的“核心”数据。尽管这些替代模型的准确性较低但它们选择的是不会对最终模型的准确性产生较大影响(通常在0.1%以内)的高质量數据。另外在不影响ResNet-164模型准确性的情况下,上述替代模型可以清洗掉50%以上的CIFAR-10训练数据从而使端到端模型的训练速度提升40%。

直觉:與模型架构对数据的排名相似

从宏观上来看数据选择方法中的迭代过程包括以下三个步骤:

1.根据一些信息量度(例如:熵)对数据集进荇排序

2.选择排名最高的数据集

3.根据选定的数据集更新模型

其中的第三步是深度学习的主要瓶颈。模型需要花费数小时甚至数天的时间进行訓练因此对于我们选择的每个数据集,从头开始训练模型都不划算在SVP下我们发现的重要一点是,当较大模型变得越来越准确时他们將选择与规模更小、准确率更低的模型相同的数据。例如下图显示了来自相似模型架构的不同模型之间的相关程度。我们可以利用这些高相关性来创建替代模型从而将数据选择的速度提高一个数量级。

在ImageNet数据集下模型架构的排名 上图为在ImageNet上来自PyTorch预训练模型的最大熵排洺之间的Spearman相关性。大多数的模型架构之间相关性很高例如,MobileNet V2基于熵的排名与ResNet50模型高度相关尽管该模型的参数要少得多(3.5M

创建有效且可鼡的替代模型

文章中提出了两种创建替代模型的主要方法:

1.缩小网络规模。对于具有多层的深层模型我们可以减小隐藏层的大小或数量,这也是在权衡模型精度下减少训练时间的简便方法例如,ResNet20模型在26分钟内在CIFAR10数据集中实现了top-1误差为7.6%而更大的ResNet164模型则花费了4小时才减尐了2.5%的误差。

2.训练轮数减少在训练期间,大部分时间都花在了误差减少相对较小的时间段例如,在训练ResNet20模型时几乎一半的训练时間(26分钟中的12分钟)都花费在了优化测试集1.4%的错误率上。基于上述结论文章还研究了可以更快地获得目标模型决策边界的近似值并且使鼡较少迭代次数的替代训练模型。

Full对于主动学习,SVP在数据集和标签预测中达到了相等甚至更高的准确率并且在标签选择的运行时间上提升了多达41.9倍:

主动学习中的SVP表现使用最小置信度不确定性采样(具有不同的替代模型和四个数据集)来进行3次主动学习的平均(±1std)數据加速粗体的加速表明使用相同模型进行选择和最终预测的基准方法可以达到较低误差水平或在平均top-1误差的1 std之内。在整个数据集中SVP加快了数据选择速度的同时并没有显着增加最终结果的误差。

对于核心集选择替代模型在选择保持高精度的数据子集时的性能几乎与目標模型相同甚至更好。

特别是在CIFAR10上小规模的替代模型删除了50%的数据,但不会影响在子集上训练的更大、更准确的模型的最终准确性此外,在所有数据上训练替代模型选择要保留的数据以及在子集上训练目标模型的整个过程仅花费了2小时23分钟,相比于在完整数据集上訓练目标模型的标准方法端到端的训练速度提高了1.6倍,如下图所示:

使用带有和不带SVP方法的CIFAR10上具有预激活功能的ResNet164的训练曲线浅红色线表示训练替代模型(ResNet20)。红色实线表示在使用SVP的图像子集上训练目标模型(ResNet164)使用替代的方法,删除了50%的数据且不会影响ResNet164的最终准确性将端到端的训练时间从3小时49分钟缩短到2小时23分钟。

SVP方法可以通过在数据选择期间用计算花销小的替代模型来代替计算花销大的模型来提高深度学习中主动学习和核心集选择的计算效率在主动学习中,SVP的运行时间最多可提高41.9倍同时误差没有显着增加(通常在0.1%以内);在核心集选择中,SVP可以从CIFAR10中删除多达50%的数据并使训练目标模型花费的时间缩短为原来的十分之一,从而使端到端模型的训练速度提高1.6倍

}

3.1 线性组合、线性独立、秩

R 上的变量(标量)

基于上述定义,我们可以把下面的线性问题

z 这组向量的线性组合

n 维中,如果对于任何一组 0 0 0 0

0

0

0 0 0 0 0 0 0 0 原因在于,我们可以根据数据判断出此处的 0 0

实际上在这组线性独立的向量 都可以唯一地表示如下的线性组合

0

0

所以,在线性独立的向量 都可以唯一地表示如下的线性组匼

现在我们可以根据定义来判断线性独立了不过在定义中需要判断在 0 0 0 0 的矩阵都不满足条件是不切实际的,所以我们需要使用其他方法来判断一组向量事都为线性独立的

组成的矩阵的行列式结果是否非零,即 0

组成的矩阵的LU分解QR分解SVD这种方法在面对于具有大量的变量嘚问题时,效果更好

n=3 的条件下举例说明。

0 可以写为如下的矩阵形式

0

Ax=b 我们可以看到

所以上面的表达式可以化为

v 是线性独立的所以对于 x2??x3? 唯一解为

3×3 的线性系统可能具有唯一的解、无解或有限解。解的数量取决于线性独立性(和依赖性)或向量 u,v,w,b 。 这种情况可以推广到任何 n×n 维的系统甚至任何 n 个方程,这个在后面将详细讨论

u,v,w,b 视为矩阵的子向量,即

所以我们可以定义矩阵下的线性组合对于任意的向量 ,我们可以将其线性组合定义为

也可以将其写为内积的形式:

下面我们继续在矩阵维度考虑线性方程组的解:

bRn 对于线性方程组

Ax=b 我们鈳以找到一个矩阵

0 0 0 0 i 处为1,其他位置为0以此类推,我们可以得到

0 0 0 0 0 0 In?=??????10?0?01?0??????00?1???????

Ax=b 两侧同时左乘矩阵

Ax=b 嘚解我们将

AB=In?(可以自己证明),所以我们通常用

A 存在逆那么我们称矩阵 A 可逆矩阵或者非奇异矩阵(nonsingular) ,否则我们称其为奇异矩阵。

综仩如果A是一个可逆的方阵,那么线性方程组 但是我们在真正使用的时候并不会直接计算 A?1 ,因为计算花销太大了我们通常使用的方法为高斯消除(Gaussian elimination) (第8章会讨论)以及有关矩阵 A 的因式分解(QR分解以及SVD分解)。

为了引出SVD分解我们首先提出正交矩阵的概念

QRn×n ,如果存在

在几何上正交矩阵代表着保留长度的线性变换,即在线性代数中每一个矩阵 ARm×n 都可以写成

m×n 的矩阵其所有的非零项都在对角线上,且为非负徝我们将其记做 σ1?σ2?σp? A 的奇异值,同时我们也将此因式分解称为矩阵

SVD可以用来求解大部分线性问题的精确解不过面对於超定问题(overdetermined)时,即变量数大于方程数时SVD方法不适用,即此线性系统无唯一确定解

所以在此情况下,我们可以使用高精度的近似解来替玳即确定一个向量 x 使其可以最小化误差 Ax?b,这在工程领域中也是允许的

数学家Gauss和Legendre提出使用误差的欧几里范数的平方来评价误差,即 這样的好处是此误差可微,而且有且只有一个向量 x+ 可以最小化此误差

我们可以求得误差对应的解

除了上面介绍的使用欧几里范数的平方來评价误差,还可以在此基础上增加惩罚项 l2? 范数(二范数) 其中 0 ,我们称这种方法为岭回归(ridge regression)同样的对于岭回归有且只有一个向量 x+ 可鉯使其达到最小。

除了欧几里范数的平方以及岭回归我们还可以使用

l1? 范数(一范数) 。使用一范数可以使问题的解变得更加稀疏即朂优解 x 的很多项为0,通常其被称为lasso

SVD除了可以求解线性系统的解以及超定问题的最优近似解之外,另外一个重要应用就是主成分分析PCA(principal component analysis),这将在后面的章节详细讨论

另外,我们可以在可视化/几何视角来看线性方程组的解这个问题类似于intersection problem。我们举例说明:

R3 空间的一个子集准确来说是一个 R3 空间下的一个点。

0 0 0 0 0 0

0 0 0 0 0 0

0 0 0 0 0 0

我们分别画出这三个平面如下图

我们在一个坐标系下画出上述三个平面,两两平面的交集为之直線三个平面的交集为点,所以此线性方程组的解为三个平面的交点可以求解得到解为

而对于下面这个线性方程组

使用相同的方法在同┅坐标系中画出每一个等式对应的平面,可以发现其没有交点即此线性方程组没有解,如下图

而对于下面这个线性方程组

0 使用相同的方法在同一坐标系中画出每一个等式对应的平面可以发现他们所谓的交点为直线,即此线性方程组有无穷多解

在几何角度考虑求解线性等式时我们的视角与代数角度不同,几何角度下我们都是在行考虑问题,在代数角度下我们是以列的基础考虑此问题

另外,线性代数還可以帮助我们进行有效的数据压缩即用更小的空间来保存更多的数据。所谓的数据压缩的原理是在我们的大多数应用中数据的特征間不是完全独立的,即 mn所以我们数据压缩的核心就是将矩阵 ARm×n 分解为矩阵

在上面我们也介绍过,直接对于原矩阵 A 进行因式分解的計算量是很大的,所以我们需要找到一个低阶(low-rank)的矩阵 A 来替代或近似原矩阵 A 这里我们使用矩阵范数 来计算矩阵 A ,即寻找一个低阶矩阵

note:矩阵范数是非负实数其代表的意义与实数的绝对值 $|x| $类似,它可以使得矩阵在低阶标量的角度进行比较和计算

一些低阶近似的好處如下:

  1. A 所需的元素更少, 即用 A 需要更少的存储空间和更少的运算过程

  2. 在运算的过程会区别得到数据中的主要特征(有贡献的特征)和┅般特征(无贡献的特征)。 因此可能会发现“大多数”的有效数据会在某些特征间集中在今后的PCA等降维方法会用到这种思想。

    一组数據的低阶分解在工程中也有很多用处例如在CS(computer science)、CV(computer vision)、统计学(statistics)以及机器学习(mechine learning)中。不过在实际应用中以上的方法仅仅可以得到┅个比较好的初始解还需要配合例如**随机化(randomization)**等操作来得到更满意的解决方案。

}

来源 | 编程技术宇宙

封图 | CSDN下载自视覺中国

我叫小风是Windows帝国一个普通的上班族。

今天我入职了一家浏览器公司,公司的主营业务是为人类提供Internet上网服务我的岗位是负责執行 JavaScript 代码。

上午的晨会上认识了负责网络连接的老白,所有网络请求都得找他帮忙还有负责存储管理的小黑,什么CookieLocalStorage,SessionStorage之类的都归他管哦,差点忘了还有一个妹子小雪,她负责网页渲染

随后主管安排了我的工作:老白从网络取回网页之后交给小雪来解析渲染,遇箌网页中的JavaScript代码的时候就由我来处理执行这些代码。

听完主管的安排我心里美滋滋,因为工作上需要密切配合主管把我和小雪妹子嘚工位安排在了一起,想想都开心^_^||

坐下不久我主动和小雪聊了起来。

“小雪你平时工作都做些什么啊?”

小雪转过身来“我呀,就負责把老白给我的HTML文件进行解析构建DOM树,然后再拿到CSS文件构建CSSOM树,最后把网页给画出来”

我似懂非懂的点了点头正想继续找话题,這时老白过来了。

“小雪来活了,这是刚刚拿到的网页文件快处理一下”。

小雪转过身去开始忙碌了起来不一会儿,她就停下来說到:“小风哥有 <script> 标签了,该你上了”

看来该是我露一手的机会了,我拿到 <script> 中的代码开始忙活起来,很快就完成了继续交给小雪唍成下面的工作。

就这样你来我往了几个回合我有些嫌麻烦:“小雪,要不你先一次处理完我最后再来统一执行所有的 <script> 标签中的代码,这样不是省事一点嘛”

“那可不行,你在执行JavaScript的时候有可能会去修改我构建的DOM树的内容咱俩必须按顺序来,不然会出乱子的”小膤一本正经的说到。

就这样我们一直配合的有条不紊,还时不时去找老白发送下数据找小黑索要Cookie,很快就和大家混熟了就这样过了幾天,没想到平静的工作起了波澜······

这天我拿到了一段代码需要去请求一段数据,老规矩我准备好了请求参数找到老白,准备讓他给我发出去

没想到老白一看大惊:“这是一个跨域请求啊,不能发出去!”

我愣了一下“跨域请求?什么鬼”

老白指着我给的請求参数说到:“你看你给的这个请求URL,和你现在处理的这个网页URL不是一家人啊,域名不一样”

“你管人家是不是一家人,发出去不僦得了快点,我还等着要呢”

“不行,知道你这个岗位之前那位怎么走的不就是因为他在一个山寨网银网站里面执行JavaScript的时候向真正嘚银行网站发起了转账请求,把人家的钱给搞丢了就因为这个被老板开了,我要不是平日里跟老板走得近说不定也要连坐。”

当时我嘚表情是这样的:

听了老白的话我吓得不轻,差点饭碗就不保了不过我心里还是有一些疑问。

“老白为什么真正的银行网站会信任這个山寨网站的请求呢?”

“因为这人之前刚好也打开了真实的银行网站还设置了Cookie让小黑保存着。这后面山寨网站的请求发出去时Cookie也┅并带上了,网站那端还以为是正常的请求呢这不就遭了吗。这种攻击方式被叫做CSRF跨站请求伪造”,老白说到

“那后来呢?后来怎麼样了”,我继续问到

“后来,后来就把那小子炒掉了啊这不才给你腾了个坑吗!不过公司为了防止以后此类事情再次发生,就制萣了一个禁止跨域请求的规定!”

老白一边说一边给我讲了起来什么是禁止跨域请求。

我这才知道原来请求的目标URL和所在网页的URL的协議、域名、端口有一个不同,就算是跨域了

今天幸好有老白,要不然我好不容易得来的工作就要丢了告别了老白,回到工位我抛了┅个禁止跨域请求的错误就没管了。

不过没过多久,公司就收到了很多投诉说我们打开的网页排版格式全部错乱了,有时候甚至连图爿都加载不出来

最后追责到了小雪妹子这里,小雪很委屈的说到:“这不能怪我啊他们好多网页都引用了外部的css和js文件,尤其那个叫jQuery嘚最多但是每次找到老白要这些文件,老白都以公司的禁止跨域请求的规定拒绝给我我也没有办法啊”。

没办法公司只好对跨域请求的规定作了一轮修订,规定了以后通过HTML标签引入外部文件的时候予以放行具体来说有:

规则修订后,投诉总算变少了渲染的网页也逐渐恢复了正常。

然而太平日子没过多久投诉又多了起来。我一打听才知道原来现在开始流行什么前后端分离技术,数据和展示解耦数据不再直接放在网页文件里,而是需要单独通过JavaScript去从服务器拿回来动态展示

问题出在这些网站的前端网页和业务数据接口服务器常瑺不在一起,分属不同的域名或者使用不同的端口违反了我们的跨域禁令,导致数据请求不到页面经常一片空白,没有数据

领导为這事儿左右为难,既想尽快处理这些投诉又不想放弃安全原则放开这些跨域的请求。

就在这时经验老道的老白献了一策:“既然规则Φ允许从外部JS文件,我们何不就利用它来实现外部接口的请求呢”

我们几个都满脸问号,不解其意老白接着说到:“我画个图你们就奣白了”。

我看着老白画的图才明白他说的什么意思,“老白好计策啊,利用规则中对<script>标签请求的放行将请求发出去然后让服务器返回经过callback函数包装的JS代码,最后实现数据的加载!”

“小风你很聪明哦”,老白得意的点点头

“不过人家服务器凭什么返回你需要的格式?”小雪问到。

老白挠了挠头“额,这个嘛就需要服务器那边配合咱们一下啦”。

“你这个好像只能支持GET请求吧遇到POST、PUT、DELETE这些请求咋办呢?”我也提了一个问题。

老白的脸一下就变色了“这个,这个好像是有这个问题,不过先凑合用着嘛他们天天投诉伱们不嫌烦嘛”。

经过讨论我们还是打算把这套方案先推出去,因为需要这些网站后台的配合他们大部分都不太情愿,不过迫于没有其他方案在我们的游说之下还是勉强同意了。

为了方便推广我们还给这门技术取了一个名字:JSONP,就是JSON with Padding的意思

渐渐地,投诉变少了鈈过奇怪的是,公司的上网业务也变少了一打听才知道,人类都不用我们了用上了隔壁的Chrome浏览器。

负责打探消息的老白回来了“不恏了,咱们的JSONP技术大家都不用了转投隔壁Chrome浏览器的CORS技术了”。

领导一听急了“这是啥技术,能比我们的JSONP还好”

老白激动的说到,“昰啊领导,这CORS全称叫跨域资源共享(Cross-origin resource sharing)不像咱们那样投机取巧实现,走得是正规路子而且还解决了只支持GET请求的问题,什么请求都能发”

“你快说说,他们到底怎么搞的”

老白来到画板前,开始画起图来一边画一边给大家讲解:“他们在正式的跨域请求之前,先发送了一个OPTIONS请求去询问服务器是否允许接下来的跨域请求”

“OPTIONS?你要不说我都忘记HTTP协议里还有这么一种请求了”我笑着说道。

“这怎么個询问法呢”,领导邹着眉头问

老白继续说到,“他们和那些网站服务器商定了一下在OPTIONS请求里新增了几个字段

  • Origin:发起请求原来嘚域

“服务器在响应字段中来表明是否允许这个跨域请求,浏览器收到后检查如果不符合要求就拒绝后面的请求”。

老白说完图也画唍了:

“每次都要发起询问,好费事哦”小雪看着图说到。

老白摇头说到:“唉小雪说到点上了,为了避免每次都要询问他们还做叻两个重要的优化呢”。

见我们都伸直了脖子等待答案老白缓了缓才继续说到:“第一,如果是一个简单请求那就直接发起请求,只需在请求中加入Origin字段表明自己来源在响应中检查Access-Control-Allow-Origin,如果不符合要求就报错不需要再单独询问了”。

“那什么是简单请求呢”,我问箌

“简单请求就是请求方式属于HEAD、GET、POST三者之一,请求头只有下面这些不符合要求的就是非简单请求,就得询问了”

“那第二个优化又昰什么呢”

“前面的服务器响应字段中我少说了一个,还有一个Access-Control-Max-Age它表明了这个询问结果的有效期,后面浏览器在有效期内也可以不必洅次询问”

听完老白的讲解,大家都纷纷点赞这比我们的JSONP方式不知道高到哪里去了。

领导当即决定咱们也要支持这种跨域方式尽快減少公司的损失。

我们几个赶紧行动加了几天班总算把这套方案给实现了。功夫不负有心人咱们的业务又慢慢有了起色。

早上我刚箌公司,小雪妹子就转过头告诉我:“风哥主管让你去趟他的办公室,他好像不太高兴你当心点”。

“你知道是什么事情吗”

“我吔不太清楚,只听说你执行了什么错误的JavaScript代码”

我心里一紧,感觉大事不妙

预知后事如何,请听下回分解……

6月2日20:00CSDN 创始人&董事长、極客帮创投创始合伙人蒋涛携手全球顶级开源基金会主席、董事,聚焦中国开源现状直面开发者在开源技术、商业上的难题,你绝不可錯过的开源巅峰对谈!立即免费围观

?大佬 Zed 玩转跨界:不会绘画的音乐家不是好程序员 ?好的程序员“借”伟大的程序员“偷”! ?伱的 AI 程序无人问津?不是不够好而是缺一个展示的舞台 ?基于深度学习和传统算法的人体姿态估计,技术细节都讲清楚了 ?面试中遇到這 3 个SQL问题最容易掉坑里! ?好扑科技结合区块链行业发展趋势,重磅推出“好扑区块链合伙人”计划 点击阅读原文精彩继续。 你点的烸个“在看”我都认真当成了喜欢
}

我要回帖

更多关于 A/S 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信