玩ev被ai打成狗了,求ai大神作品告诉我怎么打

忽悠曾的贴吧
k650 g4d1 去年年轻不懂事想着lol就行随便买了台 今年突然想吃鸡想换个cpu 但是很多人...加个8g内存条能不能带的动。。很怕内存条买完游戏准备好点进去电脑爆炸 来些稳得住的...有没有大佬告知下 百度了下说要升级win10 ***很烦win10。。。&figure&&img src=&/v2-631eb5b6762015dfa48e8c_b.jpg& data-rawwidth=&750& data-rawheight=&495& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-631eb5b6762015dfa48e8c_r.jpg&&&/figure&&p&初学机器学习可能有一个误区,就是一上来就陷入到对各种高大上算法的追逐当中。动不动就我能不能用深度学习去解决这个问题啊?我是不是要用boosting算法做一些模型融合啊?我一直持有一个观点,&b&『脱离业务和数据的算法讨论是毫无意义的』。&/b&&/p&&p&实际上按我们的学习经验,&b&从一个数据源开始,即使是用最传统,已经应用多年的机器学习算法,先完整地走完机器学习的整个工作流程,不断尝试各种算法深挖这些数据的价值,在运用过程中把数据、特征和算法搞透,真正积累出项目经验&/b& 才是最快、最靠谱的学习路径。&/p&&p&那如何获取数据和项目呢?一个捷径就是积极参加国内外各种数据挖掘竞赛,数据直接下载下来,按照竞赛的要求去不断优化,积累经验。国外的&a href=&/?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Kaggle&i class=&icon-external&&&/i&&/a&和国内的&a href=&/?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&DataCastle&i class=&icon-external&&&/i&&/a& 以及&a href=&/?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&阿里天池比赛&i class=&icon-external&&&/i&&/a&都是很好的平台,你可以在上面获取真实的数据和数据科学家们一起学习和进行竞赛,尝试使用已经学过的所有知识来完成这个比赛本身也是一件很有乐趣的事情。和其他数据科学家的讨论能开阔视野,对机器学习算法有更深层次的认识。&/p&&p&有意思的是,有些平台,比如&a href=&/?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&阿里天池比赛&i class=&icon-external&&&/i&&/a&,甚至给出了从&b&数据处理&/b&到&b&模型训练&/b&到&b&模型评估&/b&、&b&可视化&/b&到&b&模型融合增强&/b&的全部组件,你要做的事情只是参与比赛,获取数据,然后使用这些组件去实现自己的idea即可。不废话,直接划重点上干货。如果你觉得机器学习难,那一定是你打开的方式不对(认真脸)。&/p&&p&机器学习看似难度大,但对入门者来说,也还是有一条通用的学习路径。正如前几个专栏里介绍的,还有很多优秀的入门资料可以大大降低学习门槛,同时激发学习的乐趣。&/p&&p&简单的说,学习方法大概如下:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&编程技能
机器学习知识 ----& 动手实践撸代码 ----& 数据科学比赛 ----& 实际项目经验
&/code&&/pre&&/div&&p&机器学习是一个将理论算法与计算机工程技术紧密结合的领域,你需要扎实的理论基础来帮助你分析数据,同业是需要工程能力去开发模型和部署服务。所以需要【编程技能】【机器学习知识】【数学基础】三个方面军齐头并进,才能最终夺取胜利的果实。&/p&&p&转行AI的人里也可以分三类,一类是程序员出身,具有很好的工程经验;一类是统计学数学电子通信类出身,具有较为扎实的理论基础;还有一类既没有丰富的编程经验也没有扎实理论基础,例如我们学材料的...这三类同学入门AI,需要加强的部分是不一样的。&/p&&p&&b&1.编程技能-python&/b&&/p&&p&Life is short, I use python!&/p&&p&在google, facebook等巨头钦定之后,人工智能领域的当红辣子鸡莫过于python。Python的工具库还是满全的,从数据获取到数据清理和机器学习算法应有尽有。与R相比,更加全面。&/p&&p&对于python, 除掌握其自身语法外,还应该着重掌握下面这些库:&/p&&p&&a href=&/?target=http%3A//pandas.pydata.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pandas&i class=&icon-external&&&/i&&/a&:超级excel,表格式操作数据,数据清洗和预处理的强大工具。&/p&&p&&a href=&/?target=http%3A//www.numpy.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&numpy&i class=&icon-external&&&/i&&/a&:数值计算库,快的不要不要的。&/p&&p&&a href=&/?target=http%3A//matplotlib.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&matplotlib&i class=&icon-external&&&/i&&/a&:模仿MATLAB的数据可视化工具。&/p&&p&&a href=&/?target=http%3A//scikit-learn.org/stable/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&scikit-learn&i class=&icon-external&&&/i&&/a&:封装超级好的机器学习库,一些简便的算法用起来不要太顺手。&/p&&p&&a href=&/?target=http%3A//ipython.org/notebook.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ipython notebook&i class=&icon-external&&&/i&&/a&:数据科学家和算法工程师的笔记本,强力推荐。&/p&&hr&&p&&b&2.数学基础&/b&&/p&&p&微积分:是机器学习中的核心知识之一,无论是梯度下降法中的求梯度还是反向传播中的误差传递的推导都需要用到微积分。&/p&&p&线性代数:神经网络中大量的计算都是矩阵乘法,这就需要用到线性代数的知识了。计算向量的余弦相似度也要用到内积运算。此外,矩阵的各种分解办法也出现在主成分分析和奇异值分解中。&/p&&p&概率论与统计学:广义的说,机器学习的核心是统计推断。所以机器学习的巨头不少都是统计学大师,如迈克尔乔丹,杨乐坤,辛顿等。机器学习中大量的用到贝叶斯公式,隐马尔科夫模型等等。&/p&&p&诚然,数学很重要,但是我建议,具有本科数学基础的你,&b&不要花费太多时间去刷数学书&/b&,这是南辕北辙,最好的办法还是直捣黄龙学习机器学习算法,&b&到了看不懂的地方再去补充相应的数学知识&/b&,斯坦福的教程里就有大量的数学补充材料,很多时候读明白这些补充材料就够了。&/p&&p&&br&&/p&&p&&b&3.项目经验&/b&&/p&&p&&b&一个误区:&/b&很多新手初学机器学习,上来就追求复杂的深度学习模型和高大上的算法如AlexNet, ResNet。tensorflow和keras各种API全部调用一遍,却不知道自己在干什么,俗称调包侠。&/p&&p&&b&一个观点&/b&:脱离实际业务和数据的算法都是空中楼阁。&/p&&p&&b&一条路径&/b&:按照我的学习经验,从数据清洗到特征工程,再用最传统的算法把整个流程走一遍,不断的比较和尝试各种算法,把特征和算法搞透,才是最快最靠谱的学习方法。&/p&&p&&b&两个项目&/b&:国外的&a href=&/?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Kaggle&i class=&icon-external&&&/i&&/a&和&a href=&/?target=https%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&阿里云天池&i class=&icon-external&&&/i&&/a&都是获取项目经验的好途径。我的建议是每个入门机器学习的人都应该参加两个项目。一个传统机器学习应用场景的项目,如阿里移动推荐算法。通过传统应用场景熟悉逻辑斯特回归,支持向量机和梯度增强决策树等算法。一个深度学习应用场景的项目,如肺癌识别和诊断,通过深度学习应用场景熟悉深度学习各种算法的优势和应用场景。&/p&&p&就说这么多,大家放手去干吧!&/p&
初学机器学习可能有一个误区,就是一上来就陷入到对各种高大上算法的追逐当中。动不动就我能不能用深度学习去解决这个问题啊?我是不是要用boosting算法做一些模型融合啊?我一直持有一个观点,『脱离业务和数据的算法讨论是毫无意义的』。实际上按我们的学…
一、说明&p&面对网络上纷繁复杂的资料,自己真是眼花缭乱,学的毫无章法,东一榔头西一棒子,这样不仅知识不能成为体系,自己的学习进度也不容易掌握,收效甚微。突然有个想法,就是把自己这几天收藏的资料整理出文章出来,方便自己有章可依,逐步走上python小牛的境界……&/p&&p&PS:附上一些python相关的好文:&/p&&p&1.&a href=&/xiao-jing-mo/& class=&internal&&萧大的编程入门指南&/a&&/p&&p&知乎获赞无数的编程指南,介绍的不光是一门语言的入门,也是关于编程的入门,谈到了作为一名程序员,应该掌握的一些计算机知识。&/p&&p&2. &a href=&///?target=http%3A///Python/PythonStyleGuide& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python 编码风格指南中译版(Google SOC)&i class=&icon-external&&&/i&&/a&&/p&&p&3. &a href=&///?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&PythonTab中文网&i class=&icon-external&&&/i&&/a&&/p&&p&------&/p&二、Python社区&p&1. &a href=&///?target=http%3A///coding/code_oj& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python Tip社区&i class=&icon-external&&&/i&&/a&&br&&/p&&p&强烈推荐Python Tip,有刷题挑战赛,同时,也有很多在线教程!练手实操必备!&br&&/p&&p&2. &a href=&///?target=http%3A//wiki./moin/%25E9%25A6%%25A1%25B5& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&啄木鸟社区&i class=&icon-external&&&/i&&/a&&/p&&p&3. &a href=&///?target=http%3A//cocode.cc/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&编程指南社区Co&i class=&icon-external&&&/i&&/a&&/p&三、入门阶段&p&介绍一些入门的资料,对于有编程经验的同学来讲,入门资料学习并不是很费力。&/p&&p&1.&a href=&///?target=http%3A///linux/manual/python_chinese/index.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&简明教程&i class=&icon-external&&&/i&&/a&&/p&&p&入门教程里,简明教程算是细节介绍相对详细的了,知识面也覆盖的挺全,入门资料的好选择。&/p&&p&2.&a href=&///?target=http%3A///kancloud/learn-python-hard-way/49920& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&笨办法学python&i class=&icon-external&&&/i&&/a&&/p&&p&坚持看完了,尽管最后几章没去实现(主要是和我现在的需求不一致,不想花精力在那个上面)。有所收获吧,但是,确实是入门的,知识不全面,入门够用,风格特别,采用问答形式,学习过程挺有趣。&/p&&p&3.&a href=&///?target=https%3A///zh/learn/python& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python|Codecademy&i class=&icon-external&&&/i&&/a&&/p&&p&在线挑战,还没用过,貌似现在对英文资料心里还有种抵触,必须克服!!!&/p&&p&4.&a href=&///?target=https%3A///jobs/python& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&实验楼python研发工程师&i class=&icon-external&&&/i&&/a&&/p&&p&包含了Linux/Vim/Git/SQL/Python/Django/Flask等学习课程。&/p&&p&6.&a href=&///?target=http%3A///project/start-learning-python/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&老齐的零基础学Python(第二版)&i class=&icon-external&&&/i&&/a&&/p&&p&github版本,教程内容覆盖很全,也有实战项目介绍。&/p&&p&7.&a href=&///?target=http%3A///wiki/095c955c1e6d8bbfac& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&廖雪峰python2.7教程&i class=&icon-external&&&/i&&/a&&/p&&p&现在已经有python3的教程了。&/p&&p&8.&a href=&///?target=http%3A///vamei/archive//2682778.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Vamei的的python快速教程&i class=&icon-external&&&/i&&/a&&/p&&p&话说,我还加入了博主的粉丝群,后来加入了微信群,逗比一枚啊,现在好像去新加坡深造去了!博客文章还是很详细的~&/p&&p&总结到这儿我已经有乱花渐入迷人眼的感觉了!光是入门就这么多资料,看的过来吗?看完得到猴年马月啊!所以必须痛下决心,选择自己觉得好的就OK!青菜萝卜,各有所爱,别人觉得好的,可能在你这儿就是看着不舒服!好吧,自己就选择简明,笨办法,crossin,还有,codecademy!ok,暂时就这样了!&/p&四、充实阶段&p&入门之后,对于这个语言的细节需要更进一步的了解,那么提升阶段必不可少。同时,对于计算机基础不好的同学,了解计算机及编程相关背景知识也很关键。&/p&&p&1.&a href=&///?target=http%3A///.html%3Fjd_pop%3Dbd44a477-d2b4-4158-bd1e-ff5dc5a3ff3e%26abt%3D3& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《Python基础教程》&i class=&icon-external&&&/i&&/a&&/p&&p&根据自己学习javascript的经验,一本好的教材真是获益匪浅,它能让你明白很多底层的东西。比如红宝书《js高级程序设计》中关于闭包、原型链的讲解就非常详细!好吧,扯远了,因此,学习python也是一样,光是靠博客,在线文章是不能深入了解它的,选择一门经典教材是你深入了解一门语言的必经之路!当然,也有推荐&a href=&///?target=http%3A///transfer.php%3Fsys_id%3D1%26ad_type%3D10%26from%3DP-backurl%3Dhttp%253A%252F%%252Fproduct.aspx%253Fproduct_id%253D& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《Python核心编程(第二版)》&i class=&icon-external&&&/i&&/a&的,但是自己只买了&a href=&///?target=http%3A///.html%3Fjd_pop%3Dbd44a477-d2b4-4158-bd1e-ff5dc5a3ff3e%26abt%3D3& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《Python基础教程》&i class=&icon-external&&&/i&&/a&因此,不做评价了,选中一本经典就可以了!何况自己离吃透它,还有很远的距离的!&/p&&p&2. &a href=&///?target=http%3A///special/opencourse/bianchengdaolun.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&MIT计算机科学及编程导论&i class=&icon-external&&&/i&&/a&&/p&&p&3. &a href=&///?target=http%3A///special/opencourse/cs50.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Harvard:计算机科学cs50&i class=&icon-external&&&/i&&/a&&/p&&p&2和3属于计算机入门课,之所以放到这儿,是因为介绍了计算机领域中相关的知识点,了解数据结构相关知识。其中,MIT的导论课老师的知识点是基于Python的,在学习时也能巩固Python。&a href=&/xiao-jing-mo/& class=&internal&&编程入门指南&/a&中强烈推荐的的两门公开课。(PS:网易真是良心,这两门课都有中英字幕的视频!)&/p&&p&4. &a href=&///?target=http%3A//115.29.188.128/static/wechat/index.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Crossin教室&i class=&icon-external&&&/i&&/a&&/p&&p&除了python教程之外,还有小程序,练手很好!在第一阶段入门之后,来这里做应用小程序,会找到成就感!除此之外,还有git等其他教程。是个不错的入门练手的地方。&/p&五、升华阶段&p&有了扎实的基础,那么方向的选择显得尤为重要了。是数据分析,是web开发,还是游戏开发。下面暂时分为这三个方面整理一下:&/p&5.1 数据分析&p&1. &a href=&///?target=http%3A///subject//& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《利用Python进行数据分析》&i class=&icon-external&&&/i&&/a&&/p&&p&这本书是一本大而全的利用Python数据分析的书,数据分析入门肯定够够的,写的也很详细。书的作者就是开发了用于数据分析的著名开源Python库——pandas的作者!&/p&&p&2. &a href=&///?target=http%3A//nbviewer.ipython.org/github/jrjohansson/scientific-python-lectures/tree/master& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&scientific-python-lectures&i class=&icon-external&&&/i&&/a&&/p&&p&英文资料,对Python数据分析中要用到的一些库,pandas,numpy,matplotlib等等做了简要介绍。Ipython Notebook形式的资料,示例代码都很全。&/p&&p&3. &a href=&///?target=http%3A//reverland.org/python//matplotlib-tutorial/%23scatter-plots& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Matplotlib Tutorial(译)&i class=&icon-external&&&/i&&/a&&/p&&p&Python制图的入门资料,强烈推荐!在线版的资料,作者排版也很舒服,示例代码也有,推荐!&/p&&p&4. &a href=&///?target=http%3A//old.sebug.net/paper/books/scipydoc/index.html%23& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&用Python做科学计算&i class=&icon-external&&&/i&&/a&&/p&&p&最新发现的科学计算很棒的综合性教程,更新到这儿,需要的同学自取!强烈推荐!&/p&5.2 web开发&p&1. &a href=&///?target=http%3A///django/django-tutorial.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&自强学堂Django基础教程&i class=&icon-external&&&/i&&/a&&/p&&p&很详细的一个Django教程,作者很详细的介绍了每一步。有问题,作者回复也很详细,推荐!同时,自强学堂上也有很多其他教程,是个不错的网站,收藏!&/p&&p&2. &a href=&///?target=https%3A//andrew-liu.gitbooks.io/django-blog/content/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Django搭建简易博客教程&i class=&icon-external&&&/i&&/a&&/p&&p&建议和1结合看,1的介绍相对更详细一点。&/p&&p&3. &a href=&///?target=http%3A///flask-mega-tutorial/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&欢迎进入Flask大型教程项目&i class=&icon-external&&&/i&&/a&&/p&&p&4. &a href=&///?target=http%3A///flask/index.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Flask指南&i class=&icon-external&&&/i&&/a&&/p&5.3 游戏开发&p&1. &a href=&///?target=http%3A//eyehere.net/2011/python-pygame-novice-professional-index/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&用Python和Pygame写游戏-从入门到精通&i class=&icon-external&&&/i&&/a&&/p&六、 计算机素养&p&1.&a href=&///?target=http%3A///subject/5333562/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&《深入理解计算机系统》&i class=&icon-external&&&/i&&/a&&/p&七、 Python面试题&p&1. &a href=&///?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&聊聊Python面试那些事儿&i class=&icon-external&&&/i&&/a&&/p&&br&&p&欢迎回访个人博客?&a href=&///?target=http%3A//michaelxiang.me//python-files-list/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python入门资料大全(更新ing)&i class=&icon-external&&&/i&&/a&&/p&&br&&p&-----------------------------------------------更新-----------------------------------------------&/p&&ul&&li&&a href=&///?target=http%3A///a/5821& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python机器学习入门资料整理&i class=&icon-external&&&/i&&/a&&/li&&/ul&
一、说明面对网络上纷繁复杂的资料,自己真是眼花缭乱,学的毫无章法,东一榔头西一棒子,这样不仅知识不能成为体系,自己的学习进度也不容易掌握,收效甚微。突然有个想法,就是把自己这几天收藏的资料整理出文章出来,方便自己有章可依,逐步走上python小…
&p&大学理工科的学生都要学习C语言,那么为什么要学习这个比自己岁数都大的编程语言呢?&/p&&p&网上曾经流传过一句话:当你精通C语言的时候,你会发现C语言除了生孩子,别的没有什么是C语言办不到的。我们来看一下其他语言无法比拟的C语言的优势:&/p&&ul&&li&C语言执行效率很高,仅次于汇编语言,并且功能很强大,好多编程软件都是基于C语言开发的;&/li&&li&C语言短小精悍,容易上手,有了C语言的基础,学习其他语言都会更加容易;&/li&&li&C语言是最接近硬件的高级语言,无论是深造计算机语言还是编写操作系统驱动程序,都会变得简单。&/li&&/ul&&p&这就是C语言为什么能够成为大学理工科教育中必不可少的一门编程语言了。&/p&&p&废话不多说,现在就开始学习吧,我们已经为你准备了从入门到实战完整的一套课程,点击这里开始学习:&/p&&p&&a href=&/?target=http%3A///m/28223/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&C语言学习教程 - 阿里云大学&i class=&icon-external&&&/i&&/a&(点击开始学习)&/p&&blockquote&&b&课程目录:&/b&&br&第1 章 : 常量&br&课时1:常量和变量_C语言简介 &br&课时2:常量和变量_helloworld程序 &br&课时3:常量和变量_数据类型 &br&课时4:常量和变量_常量 &br&课时5:常量和变量_符号常量 &br&课时6:常量和变量_变量定义 &br&课时7:常量和变量_变量的初始化和赋值 &br&课时8:常量和变量_格式化输入函数 &br&课时9:常量和变量_getchar函数 &br&课时10:常量和变量_格式控制符 &br&课时11:常量和变量_单位转换问题 &br&第2 章 : 运算符与表达式&br&课时12:运算符与表达式_算数运算符和赋值运算符 &br&课时13:运算符与表达式_自加运算符 &br&课时14:运算符与表达式_自增自减运算符 &br&课时15:运算符与表达式_复合赋值运算符 &br&课时16:运算符与表达式_关系运算符和逻辑运算符 &br&课时17:运算符与表达式_逗号运算和sizeof &br&课时18:运算符与表达式_运算符的优先级和结和性 &br&课时19:运算符与表达式_类型转换 &br&第3 章 : 分支语句&br&课时20:分支语句_if语句 &br&课时21:分支语句_if-else语句 &br&课时22:分支语句_else-if语句 &br&课时23:分支语句_if-else_整除问题 &br&课时24:分支语句_if-else仿密码输入 &br&课时25:分支语句_switch语句 &br&课时26:分支语句_共用case语句 &br&课时27:分支语句_练习1 &br&课时28:分支语句_练习2 &br&第4 章 : 循环语句&br&课时29:循环语句_类型转换补充 &br&课时30:循环语句_while循环 &br&课时31:循环语句_for循环 &br&课时32:循环语句_for循环练习 &br&课时33:循环语句_dowhile循环&br&课时34:循环语句_死循环及其应用 &br&课时35:循环语句_辅助控制语句 &br&课时36:循环语句_鸡兔同笼问题 &br&课时37:循环语句_练习1&br&课时38:循环语句_练习2 &br&课时39:循环语句_练习3 &br&第5 章 : 数组&br&课时40:数组_数组定义 &br&课时41:数组_数组初始化和数组元素 &br&课时42:数组_练习1 &br&课时43:数组_练习2 &br&课时44:数组_练习3 &br&课时45:数组_练习4 &br&课时46:数组_练习5 &br&课时47:数组_冒泡排序 &br&课时48:数组_排序练习 &br&课时49:数组_复习 &br&第6 章 : 二维数组&br&课时50:二维数组_基本概念&br&课时51:二维数组_内存结构 &br&课时52:二维数组_练习1 &br&课时53:二维数组_练习2&br&第7 章 : 字符串&br&课时54:字符串_操作函数1 &br&课时55:字符串_输入输出 &br&课时56:字符串_操作函数2 &br&课时57:字符串_操作函数3 &br&课时58:字符串_操作函数练习1 &br&课时59:字符串_操作函数练习2 &br&课时60:字符串_习题课_1 &br&课时61:字符串_习题课_2 &br&课时62:字符串_习题课_3 &br&课时63:字符串_习题课_4 &br&第8 章 : 函数&br&课时64:函数_函数的意义_函数的分类 &br&课时65:函数定义&br&课时66:函数的调用原理_形参_实参 &br&课时67:函数栈深入理解 &br&课时68:函数参数的进一步说明 &br&课时69:函数调用 &br&课时70:函数的使用范围问题 &br&课时71:函数调用_函数定义实战 &br&课时72:函数返回值 &br&课时73:函数和数组 &br&课时74:递归函数 &br&课时75:函数练习_1 &br&课时76:函数练习_2 &br&课时77:函数练习_3 &br&第9 章 : 全局变量、const关键字&br&课时78:内存分区_全局变量 &br&课时79:静态局部变量_静态全局变量 &br&课时80:const关键字 &br&第10 章 : 测试&br&课时81:测试_选择题 &br&课时82:测试_简答 &br&课时83:测试_编程题 &br&第11 章 : 指针&br&课时84:指针的含义_指针表示变量 &br&课时85:指针变量的初始化_使用 &br&课时86:指针基本应用1&br&课时87:指针基本应用2 &br&课时88:多指针指向问题的说明 &br&课时89:void类型的指针 &br&课时90:指针大小_指针运算 &br&课时91:指针与一维数组_访问数组元素 &br&课时92:指针与数组强化 &br&课时93:const指针 &br&课时94:指针与字符串 &br&课时95:指针与函数 &br&课时96:函数指针 &br&课时97:函数指针的使用 &br&课时98:二维数组的指针访问二维数组 &br&课时99:二维指针 &br&课时100:数组指针 &br&课时101:指针强化_1 &br&课时102:指针强化_2 &br&课时103:指针强化_3 &br&课时104:指针强化_4 &br&课时105:指针数组 &br&第12 章 : 结构体&br&课时106:结构体变量定义_成员访问_初始化 &br&课时107:结构体操作函数 &br&课时108:结构体定义 &br&课时109:结构体枚举的意义 &br&课时110:结构体数组排序_函数指针实战 &br&课时111:结构体指针 &br&第13 章 : 枚举、动态内存分配等&br&课时112:联合体 &br&课时113:枚举类型 &br&课时114:嵌套结构体_结构体数组 &br&课时115:员工管理设计 &br&课时116:动态内存分配 &br&课时117:野指针和内存泄露 &br&第14 章 : 链表&br&课时118:链表 &br&课时119:链表_删除节点实现 &br&课时120:顺序表的C语言表示 &br&课时121:顺序表操作函数实现 &br&第15 章 : 宏、多文件编译&br&课时122:宏定义_带参宏 &br&课时123:条件编译 &br&课时124:多文件编译 &br&第16 章 : 项目&br&课时125:C语言项目_项目流程 &br&课时126:图书管理系统_框架搭建_数据模型设计 &br&课时127:图书管理系统_借阅UI设计 &br&课时128:图书管理系统_图书借阅菜单逻辑实现&/blockquote&
大学理工科的学生都要学习C语言,那么为什么要学习这个比自己岁数都大的编程语言呢?网上曾经流传过一句话:当你精通C语言的时候,你会发现C语言除了生孩子,别的没有什么是C语言办不到的。我们来看一下其他语言无法比拟的C语言的优势:C语言执行效率很高,…
&h2&&b&前言&/b&&/h2&&p&机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为。机器学习是人工智能的核心,是使计算机具有智能的根本途径。 近年来,机器学习领域受到越来越多的关注,相关的机器学习算法开始成为热点,知乎上同类问题同样不少,如机器学习该怎么入门?机器学习、数据挖掘 如何进阶成为大神?普通程序员如何向人工智能靠拢?&/p&&p&如果你渴望奇迹,那么机器学习对你来说就是一场精神盛宴!&/p&&p&#阿里云大学#免费机器学习课程——《机器学习业务实践之路》,帮你用最短的时间快速学习#机器学习#的原理与使用方法!&/p&&p&课程以实际业务作为出发点,所有实验都提供实验流程以及实验数据。&/p&&p&点此免费学 &a href=&/?target=http%3A///m/22162/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/m/2216&/span&&span class=&invisible&&2/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&&br&&/p&&h2&&b&讲师介绍&/b&&/h2&&p&李博,花名:傲海。目前任职阿里云数据产品经理,主要负责机器学习平台的产品化建设以及对外业务应用。本科、硕士就读于北京邮电大学,曾就职于(实习)SONY和华为,从事数据相关产品开发。作为CSDN博客专家、云栖社区博客专家,长期分享IT技术相关文章,覆盖机器学习算法、Android应用及源码开发等领域。一直活跃在开发者社区,主导开发了多个GITHUB百星开源项目,并且也开发上线了多款手机APP应用。&/p&&p&&br&&/p&&h2&&b&课程介绍&/b&&/h2&&p&本系列课程为您讲述如何使用机器学习算法快速解决业务问题,会以实际业务作为出发点,所有实验都提供实验流程以及实验数据,帮您用最短的时间快速学习机器学习的原理与使用方法。&/p&&ul&&li&课时1:机器学习背景知识以及业务架构介绍&/li&&li&课时2:【在线自测】机器学习入门知识自测&/li&&li&课时3:机器学习实验工具PAI介绍&/li&&li&课时4:【项目实验】免费开通机器学习PAI&/li&&li&课时5:推荐系统-基于协同过滤的商品推荐&/li&&li&课时6:推荐系统-基于用户画像的商品推荐&/li&&li&课时7:深度学习-TensorFlow实现图像分类&/li&&li&课时8:文本分析-新闻自动分类系统&/li&&li&课时9:文本分析- 文本关键信息抽取、相似度分析&/li&&li&课时10:深度学习-图像识别课程&/li&&/ul&&figure&&img src=&/v2-ab5dd2e2a9b_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&620& data-rawheight=&444& class=&origin_image zh-lightbox-thumb& width=&620& data-original=&/v2-ab5dd2e2a9b_r.jpg&&&/figure&&p&&br&&/p&&p&&b&更多技术干货敬请关注阿里云大学知乎机构号:&/b&&a href=&/org/a-li-yun-da-xue-73/activities& class=&internal&&阿里云大学 - 知乎&/a&&/p&
前言机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为。机器学习是人工智能的核心,是使计算机具有智能的根本途径。 近年来,机器学习领域受到越来越多的关注,相关…
&p&在过去的一段时间内,我通过不断的深入学习,成长为一名不错的机器学习从业者。为此我接受了一个小时的访谈,以此来总结我学习的历程。学习机器学习主要有两种方法:理论机器学习方法和应用机器学习方法。&/p&&figure&&img src=&/v2-b7f1e97bf2e2a46f63c9fae2d003cc9a_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&339& data-rawheight=&180& class=&content_image& width=&339&&&/figure&&p&&b&理论机器学习&/b&&/p&&p&对于学习机器学习的理论方法,下面的课题应该进行深入的研究。&/p&&p&1.线性代数 -
&a href=&/?target=https%3A//ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&MIT&i class=&icon-external&&&/i&&/a&,&a href=&/?target=http%3A//nptel.ac.in/courses/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&IISc班加罗尔&i class=&icon-external&&&/i&&/a&。&/p&&p&2.微积分 -
&a href=&/?target=https%3A//www.coursera.org/learn/calculus1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&基础,Coursera&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//www.coursera.org/learn/advanced-calculus& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&高级,Coursera&i class=&icon-external&&&/i&&/a&。&/p&&p&3.概率和统计 -
&a href=&/?target=https%3A//ocw.mit.edu/courses/mathematics/18-05-introduction-to-probability-and-statistics-spring-2014/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&麻省理工学院&i class=&icon-external&&&/i&&/a&。&/p&&p&4.统计学习理论 -
&a href=&/?target=https%3A//ocw.mit.edu/courses/brain-and-cognitive-sciences/9-520-statistical-learning-theory-and-applications-spring-2003/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&麻省理工学院&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winter2016/about& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&斯坦福&i class=&icon-external&&&/i&&/a&。&/p&&p&5.机器学习 -
&a href=&/?target=https%3A//www.coursera.org/learn/machine-learning& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Coursera&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//work.caltech.edu/telecourse& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Caltech&i class=&icon-external&&&/i&&/a&。&/p&&p&接着就是阅读和研究论文,实施研究工作/新算法,发展专业知识,并进一步选择专业化的研究路径。 &/p&&p&&b&应用机器学习&/b&&/p&&p&应用机器学习需要条件。&/p&&p&1.对上述科目的基础知识(1至4)很好的理解。&/p&&p&2.&a href=&/?target=https%3A///courses/intro-to-python-for-data-science& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python&i class=&icon-external&&&/i&&/a& 或R编程语言,根据您的偏好。&/p&&p&3.学习使用所选编程语言中流行的机器学习、数据操作和可视化库。我个人使用Python编程语言,因此我将在下面详细说明。&/p&&p&4.必须知道Python库: &a href=&/?target=https%3A///community/tutorials/python-numpy-tutorial& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&numpy&i class=&icon-external&&&/i&&/a&, &a href=&/?target=https%3A///community/tutorials/pandas-tutorial-dataframe-python& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pandas&i class=&icon-external&&&/i&&/a&, &a href=&/?target=https%3A///community/tutorials/pandas-tutorial-dataframe-python& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&scikit-learn&i class=&icon-external&&&/i&&/a&, &a href=&/?target=https%3A///community/tutorials/matplotlib-tutorial-python& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&matplotlib&i class=&icon-external&&&/i&&/a&&/p&&p&5.其他流行的Python库: &a href=&/?target=https%3A///Microsoft/LightGBM& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&LightGBM&i class=&icon-external&&&/i&&/a&, &a href=&/?target=https%3A///dmlc/xgboost& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&XGBoost&i class=&icon-external&&&/i&&/a&, &a href=&/?target=https%3A//catboost.yandex/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&CatBoost&i class=&icon-external&&&/i&&/a&&/p&&p&&b&速成机器学习方法&/b&&/p&&p&如果你想了解什么是机器学习和它可能是什么样的。你可以通过这种方式进行实验,快速掌握。&/p&&p&1.了解机器学习概念概述&/p&&p&2.学习Python或R&/p&&p&3.了解并学习使用您选择的语言使用流行的库&/p&&p&&b&Python环境设置&/b&&/p&&p&&b&1.Python&/b&&/p&&p&1.1:&a href=&/?target=http%3A//Python.org& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&Python.org&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&
&a href=&/?target=https%3A//www.python.org/downloads/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&下载&i class=&icon-external&&&/i&&/a&, &a href=&/?target=https%3A///courses/intro-to-python-for-data-science& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&学习&i class=&icon-external&&&/i&&/a&&/p&&p&1.2:Anaconda
&a href=&/?target=https%3A//www.continuum.io/downloads& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&下载&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//docs.continuum.io/anaconda/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&学习&i class=&icon-external&&&/i&&/a&&/p&&p&&b&2.代码编辑器/ IDE&/b&&/p&&p&2.1:Visual Studio代码(搜索并安装Python扩展,选择最下载的一个)&/p&&p&2.2:Notepad+ +&/p&&p&2.3:&a href=&/?target=http%3A//jupyter.readthedocs.io/en/latest/install.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Jupyter&i class=&icon-external&&&/i&&/a&(与Anaconda &a href=&/?target=http%3A//jupyter.readthedocs.io/en/latest/install.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&一起&i class=&icon-external&&&/i&&/a&安装)&/p&&p&&b&3.安装python包&/b&&/p&&p&3.1:&a href=&/?target=https%3A//docs.python.org/3/installing/index.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&使用python的本地工具管理软件包&i class=&icon-external&&&/i&&/a&: pip install &package-name&&/p&&p&3.2:&a href=&/?target=https%3A//conda.io/docs/using/pkgs.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&用anaconda管理软件包&i class=&icon-external&&&/i&&/a&: conda install &package-name&&/p&&p&&b&4.管理Python(本地)虚拟环境(如果需要多个环境)&/b&&/p&&p&4.1:创建虚拟环境: python -m venv c:\path\to\env\folder&/p&&p&4.2:命令帮助: python -m venv -h&/p&&p&4.3:切换环境: activate.bat 位于虚拟环境文件夹中的脚本&/p&&p&4.4:Python(本地)虚拟环境 &a href=&/?target=https%3A//docs.python.org/3/library/venv.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&文档&i class=&icon-external&&&/i&&/a&&/p&&p&&b&5.管理Anaconda虚拟环境(如果需要多个环境)&/b&&/p&&p&5.1:默认conda环境 - root&/p&&p&5.2:列出可用的环境 - conda env list&/p&&p&5.3:创造新的环境 - conda create --name environment_name&/p&&p&5.4:切换到环境 -
activate environment_name &/p&&p&5.5:Anaconda虚拟环境&a href=&/?target=https%3A//conda.io/docs/using/envs.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&文档&i class=&icon-external&&&/i&&/a&&/p&&p&&b&机器学习概念概述&/b&&/p&&p&&b&机器学习&/b&:是一种通过函数f(x)从大量数据中找到模式的方法,该函数有效地推广到看不见的x, 从而在未被看到的数据中找到学习模式,并使机器学习模型得到训练。&/p&&p&&b&数据集:&/b&数据被用于应用机器学习,并从中找到模式。对于监督式机器学习应用程序,数据集包含 &i&x&/i& (输入/属性/自变量)和 &i&y&/i&(目标/标签/因变量)数据。对于无监督的数据,它只是 &i&x&/i&,输入和数据的输出是某种学习模式。&/p&&p&&b&Train set(数据集)&/b&:数据集的一个子集,用于(训练)机器学习算法以学习模式。&/p&&p&&b&评估/验证/交叉验证集:&/b&数据集的子集,不在训练集中,用于评估机器学习算法的工作方式。&/p&&p&&b&测试集:&/b&数据集检验学习成果。对于监督问题,训练集合测试集不能相同。对于无人监督,训练和测试集可以是相同的。&/p&&p&&b&算法类型:&/b&&/p&&p&监督学习:在监督问题中,历史数据包括需要为将来/不可见数据预测的标签。例如,对于房屋价格预测,我们有关于房屋(面积,卧室数量,位置等)和价格的数据。在对具有给定数据(X数据)和价格(Y标签)的机器学习模型进行后续训练之后,将针对新的/不可见数据(X)预测将来的价格(Y)。&/p&&p&无监督学习:在无监督学习中,没有标签或目标属性。一个典型的例子是基于学习模式的数据聚类。对于房屋细节(面积,位置,价格,卧室数量,建成日期等)的数据集,算法需要查找是否有任何隐藏的模式。例如,一些房屋非常昂贵,而另外一些则是平常的价格。一些房子很大,而一些房子的大小一般。有了这些模式,记录/数据被聚集成一组,如豪宅,非豪宅,Bunglows,公寓等。&/p&&p&强化:在强化学习中,“代理”在“环境”中起作用,并收到正面或负面的反馈。正面的反馈告诉一个代理,它做得很好,代理进行类似的计划/行动。负面反馈告诉代理商,它做了一些错误的事情,应该改变它的行动方式。代理和环境是软件/编程实现。强化学习的核心是建立一个能够成功完成一个环境中的特定任务的代理。&/p&&p&&b&常用算法:&/b&&a href=&/?target=https%3A//en.wikipedia.org/wiki/Linear_regression& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&线性回归&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//en.wikipedia.org/wiki/Logistic_regression& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Logistic回归&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//en.wikipedia.org/wiki/Support_vector_machine& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&支持向量机&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//en.wikipedia.org/wiki/K-nearest_neighbors_algorithm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&K-最近邻居&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//en.wikipedia.org/wiki/Decision_tree& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&决策树&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//en.wikipedia.org/wiki/Random_forest& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&随机森林&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A//en.wikipedia.org/wiki/Gradient_boosting& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&梯度提升&i class=&icon-external&&&/i&&/a&。&/p&&p&&b&预处理:&/b&在现实世界的场景中,机器学习算法可以直接应用的状态下,数据很少干净整洁。预处理是一个清理数据的过程,供给机器学习算法。一些常见的预处理步骤是:&/p&&p&1.缺失值:当某些值丢失时,通常通过添加中值/平均值或删除相应的行,或使用前一行的值等来处理。有很多方法可以做到这一点。究竟需要做什么取决于数据的种类。&/p&&p&2.分类变量:离散有限的一组值,像“车型”,“部门”等,这些值被转换成数字或向量。转换为矢量被称为&a href=&/?target=https%3A//en.wikipedia.org/wiki/One-hot& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&单热&i class=&icon-external&&&/i&&/a&编码。在Python中有很多方法。一些机器学习算法/库本身通过内部编码来处理分类列。一种编码方式是 在scikit-learn中使用 &a href=&/?target=http%3A//scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&sklearn.preprocessing.OneHotEncoder&i class=&icon-external&&&/i&&/a&。&/p&&p&3.比例缩放:按比例将列中的值缩减为常用比例,如0到1.在所有列中的值在一个共同的范围内可以在一定程度上提高准确性和训练速度。&/p&&p&4.异常值:异常值需要根据问题和商业案例逐个处理。&/p&&p&&b&数据转换&/b&:当数据集中的列/属性没有固有的模式时,它会被转换成log(values),sqrt(values)等等。&/p&&p&&b&特征工程:&/b&特征工程是从现有数据中获取隐藏洞察的过程。考虑一个房屋价格预测数据集,其中有“房屋宽度”,“房屋长度”,“卧室数量”和“价格”两列。在这里,我们看到房子的一个关键属性区域缺失,但可以根据“绘图宽度”和“绘图长度”进行计算。所以一个计算列,“面积”被添加到数据集。这被称为特征工程。&/p&&p&&b&训练:&/b&这是机器学习算法对给定数据进行训练以找出应用于未知数据的一般化模式的主要步骤。&/p&&p&&b&降维:&/b& &a href=&/?target=https%3A//en.wikipedia.org/wiki/Dimensionality_reduction& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Dimentionality减少&i class=&icon-external&&&/i&&/a&的目的在于找到所有功能中最重要的功能,旨在减少 &a href=&/?target=https%3A//en.wikipedia.org/wiki/Curse_of_dimensionality& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&维度&i class=&icon-external&&&/i&&/a& 的数据。您可以在&a href=&/?target=http%3A//scikit-learn.org/stable/modules/unsupervised_reduction.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&这里&i class=&icon-external&&&/i&&/a&找到更多关于降维的&a href=&/?target=http%3A//scikit-learn.org/stable/modules/unsupervised_reduction.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&信息&i class=&icon-external&&&/i&&/a&。&/p&&p&&b&评估度量标准:&/b&评估度量标准是用于评估其正确性预测的度量标准。机器学习算法在训练时使用评估度量来评估,计算成本并优化成本凸函数。尽管每个算法都有一个默认评估指标,但建议根据业务案例/问题指定确切的评估指标。&/p&&p&&b&参数调整:&/b&尽管当今最先进的算法大部分都具有合理的参数默认值,但通过调整参数来控制模型的准确性并改善总体预测,总是有帮助的。参数调整可以通过反复改变和评估准确性来反复试验。或者,可以提供一组参数值来尝试所有这些参数的不同排列,并找到最佳的参数组合。这可以&a href=&/?target=http%3A//scikit-learn.org/stable/modules/classes.html%23hyper-parameter-optimizers& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&在scikit-learn中&i class=&icon-external&&&/i&&/a&使用称为&a href=&/?target=http%3A//scikit-learn.org/stable/modules/classes.html%23hyper-parameter-optimizers& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&超参数优化器的&i class=&icon-external&&&/i&&/a&一些辅助函数完成 。&/p&&p&&b&过度拟合:&/b&过度拟合是机器学习模型几乎记忆所有训练数据并且几乎准确地预测已经在训练集中的数据的状态。这是一个模型未能概括和预测未被看见的数据的状态。可以使用正则化来处理过度拟合,如果配置不当,则调整超参数,从而阻止部分数据集使用正确的交叉验证&a href=&/?target=http%3A//scikit-learn.org/stable/modules/cross_validation.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&(1)&i class=&icon-external&&&/i&&/a&&a href=&/?target=https%3A//en.wikipedia.org/wiki/Cross-validation_%28statistics%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&(2)&i class=&icon-external&&&/i&&/a&策略。&/p&&p&&b&欠拟合(差异)&/b&:欠拟合是即使在预测训练集中的数据时,机器学习模型的预测也不会很好。这也被称为具有高方差的模型。欠拟合可以处理添加更多数据,添加/删除特征,尝试不同的机器学习算法等。&/p&&p&&b&正则化:&/b&在模型试图进一步学习(减少错误,倾向于过度拟合)的某个时刻,正则化有助于对付过度拟合效应。正则化通常是在成本/误差计算过程中添加的参数。机器学习算法可能不是明确地提供正则化参数。在这种情况下,通常还有其他一些参数可以调整,以在必要的范围内引入正规化。&/p&&p&&b&预测:&/b&为了用训练的机器学习模型进行预测,通过提供测试数据集作为参数来调用模型的预测方法。测试数据集应该按照训练数据集的方式进行预处理。换句话说,在用于训练的机器学习模型的相同格式的训练数据中。&/p&&p&&b&其他术语:&/b&&/p&&p&&b&模型堆叠:&/b&当单个学习算法不好时,多个机器学习算法被用来进行预测,并且预测以不同的方式组合在一起。最简单的是加权预测。有时,其他机器学习模型(元模型)被用在第一级模型的预测之上。这可能会达到任何复杂程度,并可能有不同的管道。&/p&&p&&b&深度学习&/b&&/p&&p&有趣的是,今天解决的所有机器学习问题中的大部分(我猜测超过90%)都是使用随机森林,梯度增强决策树,SVM,KNN,线性回归,Logistic回归来解决的。&/p&&p&但是,有一些问题不能用上述技术来解决。类似图像分类,图像识别,自然语言处理,音频处理等问题,但可以使用称为深度学习的技术来解决。在开始深入学习之前,我相信首先要掌握所有上述概念。&/p&&p&良好的深度学习资源:&/p&&p&1.&a href=&/?target=http%3A//www.fast.ai/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Fast.ai&i class=&icon-external&&&/i&&/a&
&a href=&/?target=https%3A///in/pranay-tiwari-47a49048/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Pranay Tiwari&i class=&icon-external&&&/i&&/a&!&/p&&p&2.&a href=&/?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&& - 一本在线书籍,强调理论和基础&i class=&icon-external&&&/i&&/a&&/p&&p&3.&a href=&/?target=https%3A//www.coursera.org/specializations/deep-learning& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Coursera的深度学习专长Andrew Ng&i class=&icon-external&&&/i&&/a&&/p&&p&4.&a href=&/?target=http%3A//www.deeplearningbook.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&deeplearningbook.org - 一本在线书籍&i class=&icon-external&&&/i&&/a&&/p&&p&如果你知道深度学习的概念,一些流行的深度学习库是:&a href=&/?target=https%3A//keras.io/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Keras&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A///Microsoft/CNTK& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&CNTK&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A///tensorflow/tensorflow& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Tensorflow&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A///tflearn/tflearn& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&tflearn&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A///pytorch/pytorch& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pytorch&i class=&icon-external&&&/i&&/a&,&a href=&/?target=https%3A///Theano/Theano& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Theano&i class=&icon-external&&&/i&&/a&。&/p&&p&&b&实践:&/b&&/p&&p&练习是最重要的,没有提及练习机器学习,这个指南是不完整的。要进一步练习和掌握你的技能,下面是你可以做的事情:&/p&&p&从各种在线数据源获取数据集。一个这样流行的数据源是 &a href=&/?target=http%3A///getting-started-with-machine-learning-in-one-hour/archive.ics.uci.edu/ml/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&UCI机器学习库&i class=&icon-external&&&/i&&/a&。&/p&&p&另外,您可以 &a href=&/?target=http%3A///search%3Fq%3Ddatasets%2Bfor%2Bmachine%2Blearning& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&搜索“机器学习数据集”&i class=&icon-external&&&/i&&/a&。&/p&&p&参加在线机器学习/数据科学比赛。一些流行的是- &a href=&/?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Kaggle&i class=&icon-external&&&/i&&/a&,&a href=&/?target=http%3A///& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&HackerEarth&i class=&icon-external&&&/i&&/a&等等。如果你最终从非常困难的事情开始,试着坚持一下。如果还觉得困难,把它停在一边,找到其他的。没有必要失望。通常在线比赛的问题有一定的难度,可能并不适合初学者。写下来你所学到的东西!这将有助于巩固你对这个问题的理解和想法。PS:可以在云栖社区发表!&/p&&p&关注数据科学,关于Quora的机器学习主题,很多伟大的建议和问题/答案。&/p&&p&&b&最后的想法:&/b&&/p&&p&如果您正在认真从事机器学习/数据科学领域,或者您正在考虑改变职业生涯,请考虑您的动机以及您为什么愿意这样做。&/p&&p&如果你确定,我有一个建议给你。 永远不要放弃。这绝对是值得的,我可以说,从过去18个月以来,我走过了这条路......几乎每一天,每个周末和每个闲暇的时间(除了我旅行时,或者完全被我的日常工作所淹没)。掌握数据科学的道路并不容易。正如他们所说: “罗马不是一天建成的!”。你需要学习很多科目,兼顾不同的学习重点。即使学了很多东西,你仍然会发现以前从来没有想过或听说过的新东西。你不断发现的新概念/新技术可能会让你觉得你还是不了解很多东西,还有更多的理由要报道。这很常见。只要坚持下去。设定大目标,计划小任务,只关注手头的任务。&/p&&p&&br&&/p&&p&本文由阿里云云栖社区组织翻译。&/p&&p&文章原标题《getting-started-machine-learning-one-hour》,&/p&&p&作者:Abhijit Annaldas是一位软件工程师,也是一位贪婪的学习者,自学获得了机器学习方面的知识和专业知识。译者:虎说八道&/p&&p&&br&&/p&&p&&b&文章为简译,更为详细的内容,请查看&a href=&/?target=http%3A///m/35816/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&原文&i class=&icon-external&&&/i&&/a&&/b&&/p&&p&&b&更多技术干货敬请关注云栖社区知乎机构号:&a href=&/org/a-li-yun-yun-qi-she-qu-48& class=&internal&&阿里云云栖社区 - 知乎&/a&&/b&&/p&
在过去的一段时间内,我通过不断的深入学习,成长为一名不错的机器学习从业者。为此我接受了一个小时的访谈,以此来总结我学习的历程。学习机器学习主要有两种方法:理论机器学习方法和应用机器学习方法。理论机器学习对于学习机器学习的理论方法,下面的课…
&p&关于深度学习,网上的资料很多,不过貌似大部分都不太适合初学者。
这里有几个原因:
1.深度学习确实需要一定的数学基础。如果不用深入浅出地方法讲,有些读者就会有畏难的情绪,因而容易过早地放弃。
2.中国人或美国人写的书籍或文章,普遍比较难一些。我不太清楚为什么,不过确实是这样子的。&/p&&p&深度学习,确实需要一定的数学基础,但真的那么难么?这个,还真没有。不信?听我来给你侃侃。看完,你也会觉得没那么难了。&/p&&p&本文是针对初学者,高手可以无视,有不对的地方,还请多多批评指正。&/p&&p&这里,先推荐一篇非常不错的文章:
《1天搞懂深度学习》,300多页的ppt,台湾李宏毅教授写的,非常棒。
不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章。&/p&&p&这是slideshare的链接:
&a href=&///?target=http%3A//www.slideshare.net/tw_dsconf/ss-Fqid%3D108adce3-2c3d-d0a57e46bc%26v%3D%26b%3D%26from_search%3D3& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.slideshare.net/tw_dsconf/ss-?qid=108adce3-2c3d-d0a57e46bc&v=&b=&from_search=3&i class=&icon-external&&&/i&&/a&&/p&&p&没梯子的同学,可以从我的网盘下:
链接:&a href=&///?target=http%3A///s/1nv54p9R& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/s/1nv54p9&/span&&span class=&invisible&&R&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& 密码:3mty&/p&&p&要说先准备什么,私以为,其实只需要知道导数和相关的函数概念就可以了。高等数学也没学过?很好,我就是想让文科生也能看懂,您只需要学过初中数学就可以了。&/p&&p&其实不必有畏难的情绪,个人很推崇李书福的精神,在一次电视采访中,李书福说:谁说中国人不能造汽车?造汽车有啥难的,不就是四个轮子加两排沙发嘛。当然,他这个结论有失偏颇,不过精神可嘉。&/p&&p&导数是什么,无非就是变化率呗,王小二今年卖了100头猪,去年卖了90头,前年卖了80头。。。变化率或者增长率是什么?每年增长10头猪,多简单。这里需要注意有个时间变量---年。王小二卖猪的增长率是10头/年,也就是说,导数是10.
函数y=f(x)=10x+30,这里我们假设王小二第一年卖了30头,以后每年增长10头,x代表时间(年),y代表猪的头数。
当然,这是增长率固定的情形,现实生活中,很多时候,变化量也不是固定的,也就是说增长率也不是恒定的。比如,函数可能是这样: y=f(x)=5x?+30,这里x和y依然代表的是时间和头数,不过增长率变了,怎么算这个增长率,我们回头再讲。或者你干脆记住几个求导的公式也可以。&/p&&p&深度学习还有一个重要的数学概念:偏导数,偏导数的偏怎么理解?偏头疼的偏,还是我不让你导,你偏要导?都不是,我们还以王小二卖猪为例,刚才我们讲到,x变量是时间(年),可是卖出去的猪,不光跟时间有关啊,随着业务的增长,王小二不仅扩大了养猪场,还雇了很多员工一起养猪。所以方程式又变了:y=f(x)=5x??+8x? + 35x? +30
这里x?代表面积,x?代表员工数,当然x?还是时间。
上面我们讲了,导数其实就是变化率,那么偏导数是什么?偏导数无非就是多个变量的时候,针对某个变量的变化率呗。在上面的公式里,如果针对x?求偏导数,也就是说,员工对于猪的增长率贡献有多大,或者说,随着(每个)员工的增长,猪增加了多少,这里等于35---每增加一个员工,就多卖出去35头猪. 计算偏导数的时候,其他变量都可以看成常量,这点很重要,常量的变化率为0,所以导数为0,所以就剩对35x? 求导数,等于35. 对于x?求偏导,也是类似的。
求偏导我们用一个符号 表示:比如 y/ x? 就表示y对 x?求偏导。&/p&&p&废话半天,这些跟深度学习到底有啥关系?有关系,我们知道,深度学习是采用神经网络,用于解决线性不可分的问题。关于这一点,我们回头再讨论,大家也可以网上搜一下相关的文章。我这里主要讲讲数学与深度学习的关系。先给大家看几张图:&/p&&figure&&img src=&/v2-cbe0cdfd0af76d328ebe_b.png& data-rawwidth=&631& data-rawheight=&488& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&/v2-cbe0cdfd0af76d328ebe_r.png&&&/figure&&p& 图1. 所谓深度学习,就是具有很多个隐层的神经网络。&/p&&figure&&img src=&/v2-0d5accd6d800be9f933b_b.jpg& data-rawwidth=&432& data-rawheight=&576& class=&origin_image zh-lightbox-thumb& width=&432& data-original=&/v2-0d5accd6d800be9f933b_r.jpg&&&/figure&&br&&p&图2.单输出的时候,怎么求偏导数&/p&&figure&&img src=&/v2-c52b1fcdd42c3ace40a8619_b.jpg& data-rawwidth=&432& data-rawheight=&576& class=&origin_image zh-lightbox-thumb& width=&432& data-original=&/v2-c52b1fcdd42c3ace40a8619_r.jpg&&&/figure&&p&图3.多输出的时候,怎么求偏导数。后面两张图是日语的,这是日本人写的关于深度学习的书。感觉写的不错,把图盗来用一下。所谓入力层,出力层,中间层,分别对应于中文的:输入层,输出层,和隐层。&/p&&p&大家不要被这几张图吓着,其实很简单的。干脆再举一个例子,就以撩妹为例。男女恋爱我们大致可以分为三个阶段:
1.初恋期。相当于深度学习的输入层。别人吸引你,肯定是有很多因素,比如:身高,身材,脸蛋,学历,性格等等,这些都是输入层的参数,对每个人来说权重可能都不一样。
2.热恋期。我们就让它对应于隐层吧。这个期间,双方各种磨合,柴米油盐酱醋茶。
3.稳定期。对应于输出层,是否合适,就看磨合得咋样了。&/p&&p&大家都知道,磨合很重要,怎么磨合呢?就是不断学习训练和修正的过程嘛!比如女朋友喜欢草莓蛋糕,你买了蓝莓的,她的反馈是negative,你下次就别买了蓝莓,改草莓了。
------------------------------------------------------------------------------------------------
看完这个,有些小伙可能要开始对自己女友调参了。有点不放心,所以补充一下。
撩妹和深度学习一样,既要防止欠拟合,也要防止过拟合。所谓欠拟合,对深度学习而言,就是训练得不够,数据不足,就好比,你撩妹经验不足,需要多学着点,送花当然是最基本的了,还需要提高其他方面,比如,提高自身说话的幽默感等,因为本文重点并不是撩妹,所以就不展开讲了。这里需要提一点,欠拟合固然不好,但过拟合就更不合适了。过拟合跟欠拟合相反,一方面,如果过拟合,她会觉得你有陈冠希老师的潜质,更重要的是,每个人情况不一样,就像深度学习一样,训练集效果很好,但测试集不行!就撩妹而言,她会觉得你受前任(训练集)影响很大,这是大忌!如果给她这个映象,你以后有的烦了,切记切记!
------------------------------------------------------------------------------------------------&/p&&p&深度学习也是一个不断磨合的过程,刚开始定义一个标准参数(这些是经验值。就好比情人节和生日必须送花一样),然后不断地修正,得出图1每个节点间的权重。为什么要这样磨合?试想一下,我们假设深度学习是一个小孩,我们怎么教他看图识字?肯定得先把图片给他看,并且告诉他正确的答案,需要很多图片,不断地教他,训练他,这个训练的过程,其实就类似于求解神经网络权重的过程。以后测试的时候,你只要给他图片,他就知道图里面有什么了。&/p&&p&所以训练集,其实就是给小孩看的,带有正确答案的图片,对于深度学习而言,训练集就是用来求解神经网络的权重的,最后形成模型;而测试集,就是用来验证模型的准确度的。&/p&&p&对于已经训练好的模型,如下图所示,权重(w1,w2...)都已知。&/p&&figure&&img src=&/v2-9e08dbbab5aa63b6527bd4_b.png& data-rawwidth=&940& data-rawheight=&736& class=&origin_image zh-lightbox-thumb& width=&940& data-original=&/v2-9e08dbbab5aa63b6527bd4_r.png&&&/figure&&p&
图4&/p&&figure&&img src=&/v2-ef5ad0d06a316f762ff43_b.png& data-rawwidth=&776& data-rawheight=&174& class=&origin_image zh-lightbox-thumb& width=&776& data-original=&/v2-ef5ad0d06a316f762ff43_r.png&&&/figure&&p&
图5&/p&&p&我们知道,像上面这样,从左至右容易算出来。但反过来呢,我们上面讲到,测试集有图片,也有预期的正确答案,要反过来求w1,w2......,怎么办?&/p&&p&绕了半天,终于该求偏导出场了。目前的情况是:&/p&&p&1.我们假定一个神经网络已经定义好,比如有多少层,都什么类型,每层有多少个节点,激活函数(后面讲)用什么等。这个没办法,刚开始得有一个初始设置(大部分框架都需要define-and-run,也有部分是define-by-run)。你喜欢一个美女,她也不是刚从娘胎里出来的,也是带有各种默认设置的。至于怎么调教,那就得求偏导。&/p&&p&2.我们已知正确答案,比如图2和3里的r,训练的时候,是从左至右计算,得出的结果为y,r与y一般来说是不一样的。那么他们之间的差距,就是图2和3里的E。这个差距怎么算?当然,直接相减是一个办法,尤其是对于只有一个输出的情况,比如图2; 但很多时候,其实像图3里的那样,那么这个差距,一般可以这样算,当然,还可以有其他的评估办法,只是函数不同而已,作用是类似的:&/p&&figure&&img src=&/v2-e5ddd26d65aa04ed82f2a51fc8212427_b.png& data-rawwidth=&484& data-rawheight=&102& class=&origin_image zh-lightbox-thumb& width=&484& data-original=&/v2-e5ddd26d65aa04ed82f2a51fc8212427_r.png&&&/figure&&p&不得不说,理想跟现实还是有差距的,我们当然是希望差距越小越好,怎么才能让差距越来越小呢?得调整参数呗,因为输入(图像)确定的情况下,只有调整参数才能改变输出的值。怎么调整,怎么磨合?刚才我们讲到,每个参数都有一个默认值,我们就对每个参数加上一定的数值?,然后看看结果如何?如果参数调大,差距也变大,你懂的,那就得减小?,因为我们的目标是要让差距变小;反之亦然。所以为了把参数调整到最佳,我们需要了解误差对每个参数的变化率,这不就是求误差对于该参数的偏导数嘛。&/p&&p&关键是怎么求偏导。图2和图3分别给了推导的方法,其实很简单,从右至左挨个求偏导就可以。相邻层的求偏导其实很简单,因为是线性的,所以偏导数其实就是参数本身嘛,就跟求解x?的偏导类似。然后把各个偏导相乘就可以了。&/p&&p&这里有两个点:&/p&&p&这里有两个点:一个是激活函数,这主要是为了让整个网络具有非线性特征,因为我们前面也提到了,很多情况下,线性函数没办法对输入进行适当的分类(很多情况下识别主要是做分类),那么就要让网络学出来一个非线性函数,这里就需要激活函数,因为它本身就是非线性的,所以让整个网络也具有非线性特征。另外,激活函数也让每个节点的输出值在一个可控的范围内,这样计算也方便。&/p&&p&貌似这样解释还是很不通俗,其实还可以用撩妹来打比方;女生都不喜欢白开水一样的日子,因为这是线性的,生活中当然需要一些浪漫情怀了,这个激活函数嘛,我感觉类似于生活中的小浪漫,小惊喜,是不是?相处的每个阶段,需要时不时激活一下,制造点小浪漫,小惊喜,比如;一般女生见了可爱的小杯子,瓷器之类都迈不开步子,那就在她生日的时候送一个特别样式,要让她感动得想哭。前面讲到男人要幽默,这是为了让她笑;适当的时候还要让她激动得哭。一哭一笑,多整几个回合,她就离不开你了。因为你的非线性特征太强了。&/p&&p&当然,过犹不及,小惊喜也不是越多越好,但完全没有就成白开水了。就好比每个layer都可以加激活函数,当然,不见得每层都要加激活函数,但完全没有,那是不行的。&/p&&p&由于激活函数的存在,所以在求偏导的时候,也要把它算进去,激活函数,一般用sigmoid,也可以用Relu等。激活函数的求导其实也非常简单:&/p&&figure&&img src=&/v2-aaedc22cee9ed_b.jpg& data-rawwidth=&257& data-rawheight=&159& class=&content_image& width=&257&&&/figure&&p&求导: f'(x)=f(x)*[1-f(x)]
这个方面,有时间可以翻看一下高数,没时间,直接记住就行了。
至于Relu,那就更简单了,就是f(x) 当x&0的时候y等于0,其他时候,y等于x。
当然,你也可以定义你自己的Relu函数,比如x大于等于0的时候,y等于0.01x,也可以。&/p&&p&另一个是学习系数,为什么叫学习系数?刚才我们上面讲到?增量,到底每次增加多少合适?是不是等同于偏导数(变化率)?经验告诉我们,需要乘以一个百分比,这个就是学习系数,而且,随着训练的深入,这个系数是可以变的。&/p&&p&当然,还有一些很重要的基本知识,比如SGD(随机梯度下降),mini batch 和 epoch(用于训练集的选择),限于篇幅,以后再侃吧。其实参考李宏毅的那篇文章就可以了。&/p&&p&这篇拙文,算是对我另一个回答的补充吧:
&a href=&/question//answer/?from=profile_answer_card& class=&internal&&深度学习入门必看的书和论文?有哪些必备的技能需学习? - jacky yang 的回答&/a&&/p&&p&其实上面描述的,主要是关于怎么调整参数,属于初级阶段。上面其实也提到,在调参之前,都有默认的网络模型和参数,如何定义最初始的模型和参数?就需要进一步深入了解。
不过对于一般做工程而言,只需要在默认的网络上调参就可以了,相当于用算法;
对于学者和科学家而言,他们会发明算法,难度还是不小的。向他们致敬!&/p&&p&写得很辛苦,觉得好就给我点个赞吧:)&/p&&p&------------------------------------------------------------------------------------------------&/p&&p&关于求偏导的推导过程,我尽快抽时间,把数学公式用通俗易懂的语言详细描述一下,前一段时间比较忙,抱歉:)&/p&&p&------------------------------------------------------------------------------------------------&/p&
关于深度学习,网上的资料很多,不过貌似大部分都不太适合初学者。
这里有几个原因:
1.深度学习确实需要一定的数学基础。如果不用深入浅出地方法讲,有些读者就会有畏难的情绪,因而容易过早地放弃。
2.中国人或美国人写的书籍或文章,普遍比较难一些。我…
&p&给亲推荐下各类机器学习问题的最优结果合集!附论文及实现地址索引!&/p&&p&该 GitHub 库提供了所有机器学习问题的当前最优结果,并尽最大努力保证该库是最新的。如果你发现某个问题的当前最优结果已过时或丢失,请作为问题提出来(附带:论文名称、数据集、指标、源代码、年份),我们会立即更正。&/p&&p&这是为所有类型的机器学习问题寻找当前最优结果的一次尝试。我们都无法独自完成,因此希望每一位读者参与进来。如果你发现了一个数据集的当前最优结果,请提交并更新该 GitHub 项目。&/p&&p&&b&监督学习&/b&&/p&&p&&b&一、NLP&/b&&/p&&p&&b&1、语言建模&/b&&/p&&p&以下展示了语言建模方面当前顶尖的研究成果及它们在不同数据集上的性能。&/p&&p&&br&&/p&&figure&&img src=&/v2-f324bba79f36dbbe34cc17_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&796& data-rawheight=&328& class=&origin_image zh-lightbox-thumb& width=&796& data-original=&/v2-f324bba79f36dbbe34cc17_r.jpg&&&/figure&&p&&br&&/p&&p&论文:DYNAMIC EVALUATION OF NEURAL SEQUENCE MODELS&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/pdf/.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/pdf/&/span&&span class=&invisible&&2.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:&a href=&///?target=https%3A///benkrause/dynamic-evaluation& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/benkrause/dy&/span&&span class=&invisible&&namic-evaluation&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&论文:Regularizing and Optimizing LSTM Language Models&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/pdf/.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/pdf/&/span&&span class=&invisible&&2.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:&a href=&///?target=https%3A///salesforce/awd-lstm-lm& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/salesforce/a&/span&&span class=&invisible&&wd-lstm-lm&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&论文:FRATERNAL DROPOUT&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/pdf/.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/pdf/&/span&&span class=&invisible&&6.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:&a href=&///?target=https%3A///kondiz/fraternal-dropout& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/kondiz/frate&/span&&span class=&invisible&&rnal-dropout&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&论文:Factorization tricks for LSTM networks&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/pdf/.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/pdf/&/span&&span class=&invisible&&2.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:&a href=&///?target=https%3A///okuchaiev/f-lm& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/okuchaiev/f-&/span&&span class=&invisible&&lm&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&在语言建模(Language Modelling)的四个顶尖研究成果中,我们看到 Yoshua Bengio 等人的研究 FRATERNAL DROPOUT 在 PTB 和 WikiText-2 数据集上都实现了当前最好的结果。在该篇论文中,Bengio 等人提出了一项叫做 fraternal dropout 的技术,他们首先用不同的 dropout mask 对两个一样的 RNN(参数共享)进行训练,并最小化它们 (pre-softmax) 预测的差异。这样正则项会促进 RNN 的表征对 dropout mask 具有不变性。Bengio 等人证明了他们的正则项上界为线性期望的 droupout 目标,即可以解决 droupout 因训练和推断阶段上出现的差异而导致的 Gap。&/p&&p&此外,Ben Krause 等人提出使用动态评估来提升神经序列模型的性能。Salesforce 的 Stephen Merity 等人提交的论文 LSTM 语言模型中的正则化和最优化从词层面的语言建模和调查基于 LSTM 模型中的正则化和最优化等具体问题出发研究更高效的语言建模方法。英伟达的 Oleksii Kuchaiev 等人提出了两个带映射的 LSTM 修正单元(LSTMP),并借此减少参数的数量和提升训练的速度。&/p&&p&&b&2、机器翻译&/b&&/p&&p&&br&&/p&&b&&figure&&img src=&/v2-561d0282fdf1a6dbdda2e2_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&794& data-rawheight=&245& class=&origin_image zh-lightbox-thumb& width=&794& data-original=&/v2-561d0282fdf1a6dbdda2e2_r.jpg&&&/figure&&/b&&p&&br&&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/abs/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/abs/&/span&&span class=&invisible&&2&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:&a href=&///?target=https%3A///jadore801120/attention-is-all-you-need-pytorch& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/jadore801120&/span&&span class=&invisible&&/attention-is-all-you-need-pytorch&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&、&a href=&///?target=https%3A///tensorflow/tensor2tensor& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/tensorflow/t&/span&&span class=&invisible&&ensor2tensor&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&论文:NON-AUTOREGRESSIVE NEURAL MACHINE TRANSLATION&/p&&p&论文地址:&a href=&///?target=https%3A//einstein.ai/static/images/pages/research/non-autoregressive-neural-mt.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&einstein.ai/static/imag&/span&&span class=&invisible&&es/pages/research/non-autoregressive-neural-mt.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:未公布&/p&&p&在机器翻译上,我们比较熟悉的就是谷歌大脑 Ashish Vaswani 等人关于注意力机制的研究,该模型在 WMT 2014 英法和英德数据集上都有十分不错的表现。该研究表明在编码器-解码器配置中,显性序列显性转导模型(dominant sequence transduction model)基于复杂的 RNN 或 CNN。表现最佳的模型也需通过注意力机制(attention mechanism)连接编码器和解码器。因此谷歌在该篇论文中提出了一种新型的简单网络架构——Transformer,它完全基于注意力机制,彻底放弃了循环和卷积。上图两项机器翻译任务的实验也表明这些模型的翻译质量不仅十分优秀,同时它们更能并行处理,因此这种模型所需的训练时间也能大大减少。这篇论文表明 Transformer 在其他任务上也泛化很好,能成功应用到有大量训练数据和有限训练数据的英语组别分析任务上。&/p&&p&除了这篇论文,Salesforce 和香港大学等研究者提出了能避免自回归(autoregressive)属性和并行产生输出的模型,这种模型在推断时能减少数个量级的延迟。该论文通过三个层面的训练策略展示了在 IWSLT 2016 英语-德语数据集上产生的大量性能提升,并且在 WMT2016 英语-罗马尼亚语上获得了当前顶尖的效果。&/p&&p&&b&3、文本分类&/b&&/p&&p&&br&&/p&&b&&figure&&img src=&/v2-7b033ed9a3deadf76db489_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&795& data-rawheight=&142& class=&origin_image zh-lightbox-thumb& width=&795& data-original=&/v2-7b033ed9a3deadf76db489_r.jpg&&&/figure&&/b&&p&&br&&/p&&p&论文:Learning Structured Text Representations&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/abs/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/abs/&/span&&span class=&invisible&&7&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:未公布&/p&&p&论文:Attentive Convolution&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/pdf/.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/pdf/&/span&&span class=&invisible&&9.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:未公布&/p&&p&爱丁堡大学的 Yang Liu 等人提出了学习结构化的文本表征,在这篇论文中,他们关注于在没有语篇解析或额外的标注资源下从数据中学习结构化的文本表征。虽然目前暂时还没有相应的实现代码,不过他们在 Yelp 数据集上准确度能达到 68.6。而另一篇带注意力的卷积提出了了一种 AttentiveConvNet,它通过卷积操作扩展了文本处理的视野。&/p&&p&&b&4、自然语言推理&/b&&/p&&p&&br&&/p&&b&&figure&&img src=&/v2-59c8e20da57bbef1def356b_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&798& data-rawheight=&134& class=&origin_image zh-lightbox-thumb& width=&798& data-original=&/v2-59c8e20da57bbef1def356b_r.jpg&&&/figure&&/b&&p&&br&&/p&&p&论文:DiSAN: Directional Self-Attention Network for RNN/CNN-free Language Understanding&/p&&p&论文地址:&a href=&///?target=https%3A//arxiv.org/pdf/.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&arxiv.org/pdf/&/span&&span class=&invisible&&6.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&实现地址:未公布&/p&&p&悉尼科技大学和华盛顿大学的研究者提出了 DiSAN,即一种为 RNN/CNN-free 语言理解的定向自注意力网络。该研究提出了一种新颖的注意力机制,即输入序列中每个元素之间的注意力是定向和多维的,这是一种对应特征相连接的注意力。该研究在斯坦福自然语言推理(SNLI)数据集上获得了 51.72% 的准确度。&/p&&p&&b&5、问答&/b&&/p&&p&&br&&/p&&b&&figure&&img src=&/v2-d957b2ac0ba5f_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&795& data-rawheight=&128& class=&origin_image zh-lightbox-thumb& width=&795& data-original=&/v2-d957b2ac0ba5f_r.jpg&&&/figure&&/b&&p}

我要回帖

更多关于 卡通狗ai素材 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信