请问要想开发人工智能的算法需要具备什么条件??

打开网易新闻 查看精彩图片

AI正在深度而全面地影响和改变着我们的生活。越来越多的场景,越来越多的行业,开始出现AI的身影,人类正与智能社会不期而遇。

据《卫报》7月28日报道,近日,谷歌旗下人工智能公司DeepMind进一步破解了几乎所有已知的蛋白质结构,其AlphaFold算法构建的数据库中如今包含了超过2亿种已知蛋白质结构,为开发新药物或新技术来应对饥荒或污染等全球性挑战铺平了道路。

特斯拉同样推出了基于AI的超级计算机Dojo,借助它,特斯拉可以确保宏大自动驾驶理想的达成与实现。据悉,未来将有1.5PB的数据在这里进化与训练,堪称「练功房」。有了Dojo,特斯拉将会研发出更多有关自动驾驶的技术,在超级算力的支持下,特斯拉将会在视觉感知的自动驾驶技术路线上一路狂奔。

透过以上种种迹象,可以看出,AI正在进入到大规模商用的全新发展阶段。有关统计显示,2021年,我国的AI应用市场规模约2000亿元,增速已达30%;同期,全球市场规模约9477亿元,涉及30多个行业及领域,例如:智慧城市、自动驾驶、元宇宙、工业视觉、生命科学等。未来十年,将进入大规模商业落地阶段。

据Gartner预测,到2025年,各行业的AI/ML(机器学习)渗透率将会达到70%以上,AI软件行业增长率也将达31%。

AI for Industry、AI for Science、AI for Metaverse的快速发展,带来了更多新的发展机会。同样地,整个市场对于AI云产品和服务的需求,同样开始水涨船高。如何满足如此庞大的云端需求,如何助力AI在更多场景和行业落地,成为玩家们竞争的焦点。

正是在这种背景下,AI云,被推到了新的潮头之上。

AI遍地开花,云市场供需矛盾突出

数据显示,到2030 年,中国将在人工智能理论、技术与应用方面达到世界领先水平,成为世界主要人工智能创新中心,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。

当AI时代悄然来临,一场全新的生产范式,正在各行各业上演。借助AI,我们不仅会改变传统意义上的生产方式,而且传统意义上的生产关系,都将发生一次重构与再造。如何借助AI达成新的范式,获得新的发展,成为各行各业布局的焦点。

从AI for Industry角度来看,AI生产分化为AI流水线和AI大模型两个范式。以工业化的AI流水线为代表的「黑灯工厂」将会越来越多地出现。可以预见的是,未来随着人力成本的不断增高,工业领域对于AI的需求,同样将会发生一场几何级数的深度变革。

除了AI流水线在各领域的落地和应用不断增加之外,AI大模型在自动驾驶、金融风控、智能对话等诸多场景的落地和应用,同样将会遍地开花。由此,市场对于基于AI的云端产品和服务的需求,同样将会水涨船高。

当AI for Industry开启一场表层变革的同时,AI对于基础科学的改造,同样正在进行。开篇提到的「DeepMind破解几乎所有的蛋白质机构」仅仅只是一个代表,除此之外,AI for Science业已深入到了核反应的等离子体的物理领域、计算机科学的自动编码领域、数学的领域、生命与科学领域、流体力学领域、材料学领域等诸多方面。

当如此多的基础研究开始与AI产生联系,如何对科研院所进行深度赋能,如何满足他们对于算力、数据和模型的巨大需求,同样成为一个全新的风口。

一边是日渐火热的AI云需求,一边却是青黄不接的AI云供给。

面对如此巨大的AI云需求,国内云市场布局呈现出冷热不均的发展状态。以阿里、腾讯为代表的平台型公司在进行云端市场的布局上,更多地关注的是通用云的打造。从本质上来看,这样一种通用云,更多地是在满足平台型公司自我发展的需求,更多地是横向上的,并不能够满足行业用户个性化的需求。

除了阿里、腾讯为代表的平台型公司之外,以华为、曙光为代表的硬件公司,同样也加入到了云市场的争夺战之中。同阿里、腾讯不同,这些公司更多地是从硬件的角度着手,而不是从软件角度着手。然而,云产品对于软件的需求较高,对于硬件的需求,反而并不太高。软硬结合的AI云玩家,更加受到市场的青睐。

入局玩家的参差不齐,最终所导致的一个结果就是,很多对于AI云有个性化需求的用户无法获得较为贴合自身需求的AI云产品和服务,最终,非但无法实现AI更好地商用,甚至还有可能错失AI落地的新红利。

2、AI云落地矛盾突出

通过以上分析,我们可以看出,只有具备了深厚的AI背景和积淀,才能在AI云市场上有所作为。从需求侧来看,AI需求的场景化、碎片化个性化较强,模型难以复用;训练模型的边际成本较高,需求端的资金压力较大。从供给侧来看,数据量级不断增大,数据安全的挑战较多;模型的开发周期不断被压缩;AI算力的缺口较大……

AI云在落地上所面临的一系列的困难和挑战,告诉我们,只有在AI垂直领域持续精耕,并且具备较强的AI开发能力和超强大的算力能力作为支撑,才能真正在AI云市场上有所作为。否则的话,面对庞大的AI云市场红利,只能望洋兴叹。

纵观当下的AI云市场,能够具备这些条件的玩家,可以说少之又少。以商汤为例,凭借着其在智慧城市、智慧交通、智慧商业和智慧生活等方面的布局,它业已成为AI领域的头部企业。

除了在AI领域的长期精耕之外,它还具备了强大的算力、数据和模型基础,商汤科技人工智能计算中心(AIDC),其设计算力为每秒4910 Petaflops(1 Petaflops为每秒千万亿次浮点运算),于2022年1月24日启动运营,会成为亚洲最大的人工智能计算中心之一,其建筑面积13万平方米、项目总投资约56亿元、一期机柜数量5000个。AIDC的成功落成,将进一步提升商汤的AI-as-a-Service服务以及商汤在中国人工智能行业的领先地位。

得益于在AI领域的长期实践,商汤开始了通过「标准化」的方式促进行业繁荣和百花齐放。通过底层的算力、数据、算法模型到上层的解决方案,商汤建构了一套「标准化结构」;通过发布超过49000个商用AI模型,商汤打造了可灵活配置,应用于不同场景的「标准化模型」;最后,商汤通过「生产标准化」实现协同和分工合作,将AI应用规模化落地。

有了如此多的沉淀之后,可以说,商汤进入到AI云市场,是顺理成章的,水到渠成的。

可见,在AI云市场处于一片混沌的大背景下,以商汤为代表的垂直领域的玩家们,无疑将会成为这一领域的有力竞争者。同样地,商汤们在AI云上的探索和实践,同样具有非常明显的借鉴意义,甚至可以为我们找到AI云市场的致胜之道。

AI商业化的巨大需求以及AI云市场突出的供需矛盾,让AI云市场成为一个蕴含着巨大发展潜能的新蓝海。可以预见的是,随着越来越多的玩家开始加入,特别是AI在各个行业及场景的应用逐步铺开,AI云市场必然将会发生一场激烈而又持久的竞争。

一场大幕即将开启,那么,AI云市场的致胜之道在哪呢?

尽管AI在各个行业,各个场景当中的落地和应用正在逐渐铺开,但是,在AI商用的过程当中,依然还是有很高的门槛的。无论是AI在单一场景的商用,抑或是AI在多场景当中的商用,行业用户所面临的一个最为直接的原因就是成本过高。

假设一个创业者在A轮拿到了1000万融资,传统方式需要先采购几台GPU服务器,再雇算法工程师、系统工程师、运维,可能几百万就花出去了。对于大型的企业来讲,可能不算什么。但对创业公司来说,这样的成本还是非常的高,所以,成本过高在一定程度上阻碍了很多的创新型企业的 AI应用的想法和实践。

在未来的AI云战场,同样将会面临同样的问题。如何解决AI商用过程当中成本过高的问题,成为决定玩家们在AI云市场份额大小的关键要素。从本质上来看,只有那些真正可以用强大的云计算能力,加上AI的开发能力,部署给行业用户,才能极大地节省成本,才能在AI云市场当中,占据新的市场份额。

以SenseCore商汤大装置AI云为例,它是一款基于商汤AI大装置的一套开箱即用的工业级AI工具链,无需前期投入,即可实现人工智能基础设施的全面数字化管理。未来的AI云市场上,只有像商汤这样普惠的,低成本的产品和服务,才能真正可以满足未来AI落地的需要。

总结来看,欲要在未来的AI云市场上获胜,如何尽可能地多地节省企业用户的成本,如何实现真正意义上的普惠,如何尽可能多地保证AI的商用,才是关键所在。

当AI在不同行业和场景的应用开始逐步展开和落地,对于云产品和服务的需求,同样将会呈现出千差万别的差异。如何满足不同类型的用户,对于玩家们云产品和服务的弹性,有了更高的要求。很显然,对于那些具备较强的弹性,可以满足用户的潮汐需求的玩家们来讲,无疑具备较强的竞争力。

实现AI与云的深度融合、海量丰富的应用场景、强大的算力,直接关系到AI云产品和服务的弹性。以现在的AI for Science的各种训练为例,动辄需要几百张卡,上千块甚至几千块的 GPU卡,而模型训练的一个周期一般会持续数天到数周,甚至更长的时间。

另外,AI在制药、自动驾驶等领域的落地和应用,通常会以项目制的方式来交给客户来完成,遇到重大的项目节点的时候,通常需要很强大的算力支撑,才能完成和实现。对于这些AI商用的场景来讲,它需要的是,AI云产品和服务的提供者,可以快速地扩容和缩容,并且去应对项目对于波峰和波谷的算力需求。

可见,AI在不同场景和行业的落地和应用对AI云的产品和服务的提供者,提出了很强的弹性需求。从某种意义上来讲,只有具备较强的弹性,以应对AI训练和推理的潮汐性特征,直接关系到服务行业用户的体验和需求满足的情况。

同样以商汤为例,它的SenseCore商汤大装置AI云具备卓越的可扩展性,可在1~1万张GPU卡之间无缝扩张,有效应对未来工业AI流水线以及 AI大模型的训练、验证、推理需求,通过创新普惠,打造AI云基础设施新范式。

此外,商汤智算中心能够提供强大的算力基础,它的计算和处理能力堪称“巨无霸”,其算力为4910 Petaflops。借助如此强大的弹性算力,商汤智算中心可完成100万亿参数模型的完整训练,使得AI大装置像流水线工厂,实现不同场景的算法模型的底层抽象,以模块化平台套件打造通用型服务平台,以低边际成本实现对新场景的规模化覆盖。

对于其他的AI云服务的玩家们来讲,如何像商汤一样打造强大的弹性算力,以应对不同场景,不同行业的AI商用的弹性需求,直接关系到它们是否可以在未来的AI云市场竞争中获胜。

无论是对于通用云市场来讲,还是对于垂直云市场而言,开放性的强弱,直接关系到玩家们可以在云市场上占据怎样的份额,处于怎样的地位。这一点,在AI云市场上,同样表现得较为突出。按照笔者的理解,这里的「开放」,并不仅仅只是包括上下游用户的开放,而且还包含了硬件和软件的开放,它是一种更加彻底和全面的开放。只有真正实现了真正意义上开放的玩家,才能在未来的AI云市场上取胜。

之所以会「开放性」会如此重要,主要是因为AI对于人们的生产和生活的影响开始深入和全面所导致的。现在,我们看到了AI for Industry、AI for Science在传统行业的内在运行逻辑上的深度改造;我们看到了AI for Metaverse在完善和丰富内容创作上的应用;我们看到了AI for Auto对于传统驾驶模式的深度改变……当如此多的落地和应用逐渐铺开,仅仅只是将AI云的产品和服务,停留在有限的几个场景;仅仅只是将AI云的产品好服务,封闭在几个有限的行业,很显然是远远不够的。

如何建构一个开放的生态,让不同的用户,不同的场景,不同的软硬件结合在一起,才是保证能够在AI云市场上有所作为的关键所在。

以SenseCore商汤大装置AI云为例,它的产品架构,包含了AI原生基础设施层(AI IaaS)、深度学习平台层(AI的PaaS)、算法模型层和行业解决方案等诸多方面。可以说,这个产品本身,就是一个强大的生态,就是一个开放性的系统。

在AI原生基础设施层,AI云提供了一系列针对性的AI IaaS的产品,比如,AI原生的算力池,AI优化的存储池,AI的智能网络,去提供更高性能的弹性伸缩的AI系统。在深度学习平台层,AI云会提供全套的AI数据管理、数据标注的服务及AI Studio的人工智能开发平台,会涵盖可视化建模和编码建模,模型管理、模型训练、模型部署等全栈的AI工具;在算法模型层,AI云会提供OpenMMLab人工智能算法开源体系, OpenGVLab通用视觉开源平台,OpenDILab开源决策智能平台三大核心平台。

值得一提的是,AI云还会提供AI芯片、AI PaaS软件和AI SaaS软件,实现AI软硬件的深度融合。另外,AI云还会将商汤内部大量的算法专家和学科专家开放出来,打造一个真正意义上的涵盖了不同类型的用户,不同类型的设施,不同类型的角色的开放的生态系统。

商汤在这一方面的探索,同样是值得其他的玩家们借鉴的。可以预见的是,随着AI商用的不断落地开花,对于AI基础设施的打造,需要的就是一个不断开放的生态。只有在这样一个生态之下,AI云才能真正满足不同用户,不同场景的需要,才能建构一个完整、可持续的AI云生态,才能赢得最后的胜利。

当下,AI正在深度而全面地影响着我们的生产和生活。无论是在基础科学领域,还是在工业制造领域,抑或是在其他领域,无不如此。面对AI行业如此迅猛的发展,以AI云为代表的基础设施的打造,开始释放出越来越多的新红利。可以说,AI云市场的大战业已启幕。对于每一个有志于在AI云市场上有所作为的玩家来讲,站在成本、弹性和开放性的角度来寻找取胜之道,或许才是关键所在。

商汤,作为一家长期精耕AI领域,具备了诸多AI优势的玩家,其在AI云上的探索,无疑具有很多借鉴意义的。从某种意义上来讲,商汤在AI云的探索和实践,特别是SenseCore商汤大装置AI云的发布,为未来AI云的发展指明了方向,业已成为AI云市场蓝海里的「航标」。

}

怎样成为一名优秀的算法工程师?这是很多从事人工智能学术研究和产品研发的同学都关心的一个问题。面对市场对人才的大量需求与供给的严重不足,以及高薪水的诱惑,越来越多的人开始学习这个方向的技术,或者打算向人工智能转型。市面上各种鱼龙混杂的培训班以及误导人的文章会把很多初学者带入歧途,浮躁的跟风将会让你最后收获甚微,根本达不到企业的用人要求。为了更好的帮助大家学习和成长,少走弯路,在今天的文章里,SIG的作者以自己的亲身经历和思考,为大家写下对这一问题的理解与答案。

首先来看一个高度相关的问题:一个优秀的算法工程师必须具备哪些素质?我们给出的答案是这样的:

对自己所做的问题的思考和经验

除去教育背景,逻辑思维,学习能力,沟通能力等其他方面的因素,大多数公司在考察算法工程师的技术水平时都会考虑上面这几个因素。接下来我们将按照这几个方面进行展开,详细的说明如何学习这些方面的知识以及积累经验。

与其他工作方向如、服务器开发相比,以及与科学的其他方向如网络,,分布式计算等相比,人工智能尤其是机器学习属于数学知识密集的方向。在各种书籍,论文,算法中都充斥着大量的数学公式,这让很多打算入门的人或者开始学习的人感到明显的压力。首先我们考虑一个最核心的问题:机器学习和深度学习究竟需要哪些数学知识?在SIGAI之前的公众号文章“学好机器学习需要哪些数学知识”里,我们已经给出了答案。先看下面这张表:

更多算法工程师的必读文章,请关注SIGAICN公众号

上面的表给出了各种典型的机器学习算法所用到的数学知识点。我们之前已经总结过,理解绝大多数算法和理论,有微积分/高等数学,线性代数,概率论,最优化方法的知识就够了。除流形学习需要简单的微分几何概念之外,深层次的数学知识如实变函数,泛函分析等主要用在一些基础理论结果的证明上,即使不能看懂证明过程,也不影响我们使用具体的机器学习算法。概率图模型、流形学习中基于图的模型会用到图论的一些基本知识,如果学习过离散数学或者数据结构,这些概念很容易理解。除此之外,某些算法会用到离散数学中的树的概念,但很容易理解。

如果你已经学过这些大学数学课,只要把所需的知识点复习一遍就够了。对于微积分,通俗易懂而又被广为采用的是同济版的高等数学:

在机器学习中主要用到了微分部分,积分用的非常少。具体的,用到了下面的概念:

导数和偏导数的定义与计算方法,与函数性质的关系

极值定理,可导函数在极值点处导数或梯度必须为0

雅克比矩阵,这是向量到向量映射函数的偏导数构成的矩阵,在求导推导中会用到

Hessian矩阵,这是2阶导数对多元函数的推广,与函数的极值有密切的联系

凸函数的定义与判断方法

拉格朗日乘数法,用于求解带等式约束的极值问题

其中最核心的是多元函数的泰勒展开公式,根据它我们可以推导出梯度下降法,牛顿法,拟牛顿法等一系列最优化方法。

如果你想要深入的学习微积分,可以阅读数学系的,称为数学分析:

与工科的高等数学偏重计算不同,它里面有大量的理论证明,对于锻炼数学思维非常有帮助。北大张筑生先生所著的数学分析可谓是国内这方面教材的精品。

下面来看线性代数,同样是同济版的教材:

如果想更全面系统的学习线性代数,可以看这本书:

相比之下,线性代数用的更多。具体用到的知识点有:

向量和它的各种运算,包括加法,减法,数乘,转置,内积

向量和矩阵的范数,L1范数和L2范数

矩阵和它的各种运算,包括加法,减法,乘法,数乘

行列式的定义与计算方法

机器学习算法处理的数据一般都是向量、矩阵或者张量。经典的机器学习算法输入的数据都是特征向量,深度学习算法在处理图像时输入的2维的矩阵或者3维的张量。掌握这些概念是你理解机器学习和深度学习算法的基础。

概率论国内理工科专业使用最多的是浙大版的教材:

如果把机器学习所处理的样本数据看作随机变量/向量,就可以用概率论的方法对问题进行建模,这代表了机器学习中很大一类方法。在机器学习里用到的概率论知识点有:

随机事件的概念,概率的定义与计算方法

随机变量与概率分布,尤其是连续型随机变量的概率密度函数和分布函数

常用的概率分布,包括正态分布,伯努利二项分布,均匀分布

随机变量的均值与方差,协方差

这些知识不超出普通理工科概率论教材的范围。

最后来说最优化,几乎所有机器学习算法归根到底都是在求解最优化问题。求解最优化问题的指导思想是在极值点出函数的导数/梯度必须为0。因此你必须理解梯度下降法,牛顿法这两种常用的算法,它们的迭代公式都可以从泰勒展开公式而得到。

凸优化是机器学习中经常会提及的一个概念,这是一类特殊的优化问题,它的优化变量的可行域是凸集,目标函数是凸函数。凸优化最好的性质是它的所有局部最优解就是全局最优解,因此求解时不会陷入局部最优解。如果一个问题被证明为是凸优化问题,基本上已经宣告此问题得到了解决。在机器学习中,线性回归、岭回归、支持向量机、logistic回归等很多算法求解的都是凸优化问题。

拉格朗日对偶为带等式和不等式约束条件的优化问题构造拉格朗日函数,将其变为原问题,这两个问题是等价的。通过这一步变换,将带约束条件的问题转换成不带约束条件的问题。通过变换原始优化变量和拉格朗日乘子的优化次序,进一步将原问题转换为对偶问题,如果满足某种条件,原问题和对偶问题是等价的。这种方法的意义在于可以将一个不易于求解的问题转换成更容易求解的问题。在支持向量机中有拉格朗日对偶的应用。

KKT条件是拉格朗日乘数法对带不等式约束问题的推广,它给出了带等式和不等式约束的优化问题在极值点处所必须满足的条件。在支持向量机中也有它的应用。

如果你没有学过最优化方法这门课也不用担心,这些方法根据微积分和线性代数的基础知识可以很容易推导出来。如果需要系统的学习这方面的知识,可以阅读《凸优化》,《非线性规划》两本经典教材。

编程能力是学好机器学习和深度学习的又一大基础。对于计算机类专业的学生,由于本科已经学了c语言,c++,数据结构与算法,因此这方面一般不存在问题。对于非计算机专业的人来说,要真正学好机器学习和深度学习,这些知识是绕不开的。

虽然现在大家热衷于学习,但要作为一名真正的算法工程师,还是应该好好学习一下c++,至少,机器学习和深度学习的很多底层开源库都是用它写的;很多线上的产品,无论是运行在服务器端,还是嵌入式端,都是用c++写的。此外,如果你是应届生,在校园招聘时不少公司都会面试你c++的知识。

对做算法的人来说,这本书其实不用全部看,把常用的点学完就够了。对于进阶,Effecve c++是很好的选择,不少公司的面试题就直接出自这本书的知识点:

接下来说python,相比c++来说,学习的门槛要低很多,找一本通俗易懂的入门教程学习一遍即可。

数据结构和算法是编写很多程序的基础,对于机器学习和深度学习程序也不例外。很多算法的实现都依赖于数组,链表,数,排序,查找之类的数据结构和基础算法。如果有时间和精力,把算法导论啃一遍,你会有不一样的感受:

对于应届生来说,学完它对于你通过大互联网和人工智能公司校园招聘的技术面试也非常有用。

上面说的只是编程语言的程序设计的理论知识,我们还要考虑实际动手能力。对于开发环境如gcc/g++,visual studio之类的工具,以及gdb之类的调试工具需要做到熟练使用。如果是在上开发,对linux的常用命令也要熟记于心。这方面的知识看各种具体的知识点和教程即可。另外,对于编程的一些常识,如进程,线程,虚拟内存,文件系统等,你最好也要进行了解。

在说完了数学和编程基础之后,下面我来看核心的内容,机器学习和深度学习知识。机器学习是现阶段解决很多人工智能问题的核心方法,尤其是深度学习,因此它们是算法工程师的核心知识。在这里有一个问题:是否需要先学机器学习,还是直接学深度学习?如果是一个专业的算法工程师,我的建议是先学机器学习。至少,你要知道机器学习中的基本概念,过拟合,生成模型,ROC曲线等,上来就看深度学习,如没有背景知识你将不知所云。另外,只是机器学习中的一类方法,对于很多问题,其他机器学习算法如logistic回归,随机森林,GBDT,决策树等还在被大规模使用,因此你不要把自己局限在神经网络的小圈子里。

首先来看机器学习,这方面的教材很多,周志华老师的机器学习,李航老师的统计学习方法是国内的经典。这里我们介绍国外的经典教材,首先是PRML:

此书深厚,内容全面,涵盖了有监督学习,无监督学习的主要方法,理论推导和证明详细深入,是机器学习的经典。此外还有模式分类这本书,在这里不详细介绍。

深度学习目前最权威的教程是下面这本书:

它涵盖了深度学习的方方面面,从理论到工程,但美中不足的是对应于介绍的相对较少。

强化学习是机器学习很独特的一个分支,大多数人对它不太了解,这方面的教程非常少,我们推荐下面这本书:

美中不足的是这本书对深度强化学习没有介绍,因为出版的较早。不知的版本有没有加上这方面的内容。

在这里需要强调的是,你的知识要系统化,有整体感。很多同学都感觉到自己学的机器学习太零散,缺乏整体感。这需要你多思考算法之间的关系,演化历史之类的问题,这样你就做到胸中有图-机器学习算法地图。其实,SIGAI在之前的公众号文章“机器学习算法地图”里已经给你总结出来了。

上面介绍了机器学习和深度学习的理论教材,下面来说实践问题。我们无需重复造车轮子,熟练的使用主流的开源库是需要掌握的一项技能。对于经典的机器学习,常用的库的有:

在这里我们不一一列举。借助于这些库,我们可以方便的完成自己的实验,或是研发自己的产品。对于深度学习,目前常用的有:

除此之外,还有其他的。对于你要用到的开源库,一定要理解它的原理,以及使用中的一些细节问题。例如很多算法要求输入的数据先做归一化,否则效果会非常差,而且面临浮点数溢出的问题,这些实际经验需要你在使用中摸索。如果有精力把这些库的核心代码分析一遍,你对实现机器学习算法将会更有底气。以深度学习为例,最核心的代码无非是实现:

各种层,包括它们的正向传播和反向传播

求解器,实现各种梯度下降法

这些代码的量并不大,沉下心来,我相信一周之内肯定能分析完。看完之后你会有一种豁然开朗的感觉。

接下来是各个方向的知识,与机器学习有关的应用方向当前主要有:

除此之外,还有其他一些特定小方向,在这里不一一列举。这些具体的应用方向一般都有自己的教材,如果你以后要从事此方向的研究,系统的学习一遍是必须的。

在说完理论与实践知识之后,最后我们来说经验与思考。在你确定要做某一个方向之后,对这个方向的方法要有一个全面系统的认识,很多方法是一脉相承的,如果只追求时髦看最新的算法,你很难做出学术上的创新,以及工程上的优化。对于本问题所有的经典论文,都应该化时间细度,清楚的理解它们解决了什么问题,是怎么解决的,还有哪些问题没有解决。例如:

机器视觉目标检测中的遮挡问题

推荐系统中的冷启动问题

自然语言处理中文分词中的歧义切分问题

只有经过大量的编程和实验训练,以及持续的思考,你才能算得上对这个方向深刻理解,以至于有自己的理解。很多同学对自己实现轮上的算法没有底气,解决这个问题最快的途径就是看论文算法的开源代码,在github上有丰富的资源,选择一些合适的,研究一下别人是怎么实现的,你就能明白怎么实现自己的网络结构和损失函数,照葫芦画瓢即可。

计算机以及人工智能是一个偏实践的学科,它的方法和理论既需要我们有扎实的理论功底,又需要有丰富的实践能力与经验。这两个方面构成了算法工程师最主要的素质。科学的学习路径能够让你取得好的学习效果,同时也缩短学习时间。错误和浮躁的做法则会让你最后事倍功半。这是SIGAI对想进入这个领域,或者刚进入这个领域的每个人要说的!

}

我要回帖

更多关于 学人工智能要哪些条件 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信