怎么能识别各个研究方向有哪些的大咖

说几点吧不一定准确,一家之訁欢迎拍砖啊。

1、任何语言都在更新不可能有更新慢的语言,C和C++也不例外都是与时俱进的,因此你的第一个话题,我不太赞同這也不应该是你抵制Java的理由。

2、不管怎么看银行的金融业是以数据库为核心的大型数据应用模型,而嵌入式是基于小计算平台实现一些很精巧的终端、控制类功能,这两门学科看起来离得比较远如果两个都去学,很容易导致门门通样样瘟,建议选其一门其实,就算是嵌入式本身里面都还有细分,建议你看看我这篇日记可能有点收获。(我理解的嵌入式几个发展方向--回高林植同学)

3、我的理解学習无所谓专业不专业,考试上了80分怎么都是职业学生的水平了。专业度体现在以后对客户提供的服务上是不是能有效理解客户需求,拿出量身定制的解决方案这个叫专业。

4、你老是提到银行据我所知,银行好像很少到西工大这类工科院校招聘职员因此,我只能冒昧估计你家里可能有些门路出来后可以帮助你进入银行。如果是这样我建议你一定要争取进去,因为银行待遇很好而且,只要不犯什么原则性错误应该很稳定,从纯粹工作好坏比较银行工作,远好于在公司里面做事

5、当然,进入银行后代价就是你可能没有机會在程序设计这个领域有什么发展了,因为银行是很传统和保守的行业一般不允许标新立异,也就不太允许创新程序设计,你作为业餘爱好玩玩可以但是,工作上那种高压力下的顿悟可能没有了。不过万事有得就有失,我个人认为这不是什么大问题任何时候,嘟有个爱好和饭碗之争我作为过来人,建议先考虑饭碗

6、银行的业务不是计算机,你如果进入银行以后,需要成为金融方面的专家而不是软件编程的专家,建议你转专业学习一点金融会对以后的工作帮助非常大。

7、当然这一切的前提是你有条件进入银行,如果這条假设不成立根据你提到的爱好,则建议从嵌入式试试看也许能另走一条路子也说不定。

先这么多吧欢迎讨论。

}

十一长假结束收心归来,重新投入工作如何能克服假期综合症呢?如何快速收心今天营长就携三位大咖来为你打打鸡血,指引指引未来的路他们将从自身的工作經历和学习经历的角度,告诉你未来3到5年你的努力应该朝着怎样的方向进发。

既然已经身在工业界那么我就谈谈工业界未来几年需要什么样的机器学习人才。不谈学术界主要还是因为大部分人最终不会从事研究而会奋斗在应用领域。相较而言工业界对人才的需求更加保守,这和学术界不同这受限于很多客观因素,如硬件运算能力、数据安全、算法稳定性、人力成本开支等

这个答案可能更适合两類人:

工作不久想要转行机器学习的朋友

特别厉害的技术大牛建议探索适合自己的路线,而我只能谈一谈适合大部分人的路线但在回答湔,我还是忍不住吐槽一下那种简单回答“深度学习”“大数据”,“NLP”“机器视觉”的人。这每一个领域的小方向都多如牛毛以洎然语言处理(NLP)为例,细分有自然语言生成、自然语言理解还有不同语言的语言模型。任何一个方向花几十年研究也不为过只给出几个芓的答案和买彩票有什么区别...

因此大部分机器学习实践者还是该脚踏实地。盲目追逐热点很容易跌进陷阱而巩固基础、寻找自己擅长的領域和机器学习交叉点可以帮助你在未来的就业市场变得炙手可热,成为工业界最紧缺的人才

/question//answer/),特定领域的知识帮助我们更好的解释机器学习模型的结果得到老板和客户的认可,这才是算法落了地能写代码、构建模型的人千千万,但理解自己在做什么并从中结合自巳的领域知识提供商业价值的人少之又少。所以调侃一句哪个方向的机器学习人才最紧缺?答:每个领域都需要专精的机器学习人才伱对特定领域的理解就是你的武器。

当然给喂鸡汤不给勺很不厚道,所以我也会给出一些具体建议再次申明,我的建议仅给以就业为目的的朋友走研究路线我有不同的建议,本文不再赘述

/question//answer/)。最低程度下我建议掌握五个小方向对于现在和未来几年内的工业界够用了。再一次重申我对于算法的看法是大部分人不要造轮子,不要造轮子不要造轮子!只要理解自己在做什么,知道选择什么模型直接調用API和现成的工具包就好了。

回归模型(Regression)学校的课程中其实讲得更多的都是分类,但事实上回归才是工业届最常见的模型比如产品定价戓者预测产品的销量都需要回归模型。现阶段比较流行的回归方法是以数为模型的xgboost预测效果很好还可以对变量重要性进行自动排序。而傳统的线性回归(一元和多元)也还会继续流行下去因为其良好的可解释性和低运算成本。如何掌握回归模型建议阅读Introduction

分类模型(Classification)。这个属於老生常谈了但应该对现在流行并将继续流行下去的模型有深刻的了解。举例随机森林(Random Forests)和支持向量机(SVM)都还属于现在常用于工业界的算法。可能很多人想不到的是逻辑回归(Logistic Regression)这个常见于大街小巷每一本教科书的经典老算法依然占据了工业界大半壁江山。这个部分推荐看李航《统计学习算法》挑着看相对应的那几章即可。

Networks)我没有把神经网络归结到分类算法还是因为现在太火了,有必要学习了解一下随著硬件能力的持续增长和数据集愈发丰富,神经网络的在中小企业的发挥之处肯定会有三五年内,这个可能会发生但有人会问了,神經网络包含内容那么丰富比如结构,比如正则化比如权重初始化技巧和激活函数选择,我们该学到什么程度呢我的建议还是抓住经典,掌握基本的三套网络: a. 普通的ANN b. 处理图像的CNN c. 处理文字和语音的RNN(LSTM)对于每个基本的网络只要了解经典的处理方式即可,具体可以参考《深度學习》的6-10章和吴恩达的Deep Learning网课(已经在网易云课堂上线)

数据压缩/可视化(Data Compression & Visualization)。在工业界常见的就是先对数据进行可视化比如这两年很火的流形學习(manifold learning)就和可视化有很大的关系。工业界认为做可视化是磨刀不误砍柴工把高维数据压缩到2维或者3维可以很快看到一些有意思的事情,可能能节省大量的时间学习可视化可以使用现成的工具,如Qlik

Learning)工业界的另一个特点就是大量的数据缺失,大部分情况都没有标签以最常見的反诈骗为例,有标签的数据非常少所以我们一般都需要使用大量的无监督,或者半监督学习来利用有限的标签进行学习多说一句,强化学习在大部分企业的使用基本等于0估计在未来的很长一阵子可能都不会有特别广泛的应用。

基本功的意义是当你面对具体问题的時候你很清楚可以用什么武器来处理。而且上面介绍的很多工具都有几十年的历史依然历久弥新。所以以3-5年的跨度来看这些工具依嘫会非常有用,甚至像CNN和LSTM之类的深度学习算法还在继续发展迭代当中无论你现在还在学校还是已经开始工作,掌握这些基本的技术都可鉯通过自学在几个月到一两年内完成

有了基本功只能说明你可以输出了,怎么才能使得你的基本功不是屠龙之术必须要结合领域知识,这也是为什么我一直劝很多朋友不要盲目转机器学习从零做起而学生朋友们可以更多的关注自己感兴趣的领域,思考如何可以把机器學习运用于这个领域比如我自己对历史和哲学很感兴趣,常常在思考机器学习和其他文科领域之间的联系也写过一些开脑洞的文章「 帶你了解机器学习(一): 机器学习中的“哲学”」。

而已经有了工作/研究经验的朋友要试着将自己的工作经历利用起来。举例不要做机器學习里面最擅长投资的人,而要做金融领域中最擅长机器学习的专家这才是你的价值主张(value proposition)。最重要的是机器学习的基本功没有大家想嘚那么高不可攀,没有必要放弃自己的本专业全职转行沉没成本太高。通过跨领域完全可以做到曲线救国化劣势为优势,你们可能比呮懂机器学习的人有更大的行业价值

举几个我身边的例子,我的一个朋友是做传统软件工程研究的前年他和我商量如何使用机器学习鉯GitHub上的commit历史来识别bug,这就是一个很好的结合领域的知识如果你本身是做金融出身,在你补足上面基本功的同时就可以把机器学习交叉運用于你自己擅长的领域,做策略研究我已经听说了无数个“宣称”使用机器学习实现了交易策略案例。虽不可尽信但对特定领域的罙刻理解往往就是捅破窗户的那最后一层纸,只理解模型但不了解数据和数据背后的意义导致很多机器学习模型只停留在好看而不实用嘚阶段。

换个角度思考不同领域的人都有了对机器学习的理解能更好的促进这个技术落地,打破泡沫的传言而对于大家而言,不用再擔心自己会失业还能找到自己的角度在这个全民深度学习的时代找到“金饭碗”。所以我建议各行各业的从业者不必盲目的转计算机或鍺机器学习而应该加深对本专业的了解并自学补充上面提到的基本功,自己成为这个领域的机器学习专家

没有什么不会改变,这个时玳的科技迭代速度很快从深度学习开始发力到现在也不过短短十年,所以没有人知道下一个会火的是什么以深度学习为例,这两年非瑺火的对抗生成网络(GAN)多目标学习(multi-lable learning),迁移学习(transfer learning)都还在飞速的发展有关于深度学习为什么有良好泛化能力的理论猜想文章在最新的NIPS听说也錄了好几篇。这都说明了没有什么行业可以靠吃老本一直潇洒下去我们还需要追新的热点。但机器学习的范围和领域真的很广上面所說的都还是有监督的深度学习,无监督的神经网络和深度强化学习也是现在火热的研究领域所以我的建议是尽量关注、学习了解已经成熟和已经有实例的新热点,不要凡热点必追

如果你有这些基本功和良好的领域结合能力,三年五年绝不是职业的瓶颈期甚至十年都还呔早。科技时代虽然给了我们很大的变革压力但也带给了我们无限的可能。技术总会过时热点总会过去,但不会过去的是我们不断追求新科技的热情和对自己的挑战

这个问题本身是很赞的,学以致用才是最好的

这个问题不是很好回答。前一半问题是“哪个方向”姒乎讲的是领域和研究方向有哪些,后一半问题“最紧缺人才”又和就业有关。所以我的回答尽量把这两方面兼顾先谈就业和工业界緊缺的人才,再说说学术界缺少的人才

我最近被两个前辈抓到他们的创业公司做暑期实习,公司是什么最好就不说了但除我之外还骗來了一个清华的本科生(从北京骗到了硅谷)。两位前辈一个是Sebastian Thrun(赛巴斯提安·特龙)的学生,一位是Stefano Ermon的学生去年在AAAI拿了个最佳论文的獎。

我虽然对工业界一直都不太熟悉但借这个机会算是好好看到了一番目前人工智能创业公司的有趣情景。虽然不一定能当做借鉴但┅些经验对目前在校或者刚离校的学生来讲也许会有帮助。

能灵活解决问题的人很缺

在我被抓去之前他们有另外一个名叫Daniel(丹尼尔)的研究生帮忙,丹尼尔也是一位人工智能方向的研究生丹尼尔负责的模块是文本的聚类算法。我对聚类算法一窍不通之前还把KNN和K-means搞混了。公司创始人Zayd(札德)告诉我他们的文本簇群(cluster)总是有问题,丹尼尔调整聚类算法的参数已经6个月但是根本没办法提升质量。

我用叻一周的时间读丹尼尔的代码(够慢了吧完全赶不上很多国内的优秀学生),然后打开Jupyter Notebook开始一点点的做分析最后发现丹尼尔把文本距離的算法做错了,任何从事自然语言处理的人都明白edit distance(编辑距离)的首选就是莱文斯坦距离(Levenshtein距离)就算不是做自然语言处理的,这个距离在计算机界也用的很多但这个距离压根不存在于丹尼尔的任何代码中。然后我把这一行加入进去代码跑了5小时,最后给札德说:峩做完了检查质量吧。

一周后丹尼尔就被炒鱿鱼了……然后公司的另一个创始人Russel(罗素)开始到处宣传我用了一周解决了别人六个月嘟解决不了的问题。(当然丹尼尔最后找到了一份谷歌的工作,开开心心的做机器人去了)

举这个例子想说明一件事:(创业公司真是沒有安全感)要建立起在某个领域的直觉和精通。这个精通并不单单是掌握一两个(甚至是好几个)算法就可以了的深度学习总爱鼓吹一个模型解决所有问题,但是等你真正进入公司后才发现这基本是不可能的

基础是必须扎实的,这个基础最好是某一个领域将近20-30年的知识的积累只会跑个LSTM是肯定不行的。

这里要讲另外一个同学的例子了他的名字叫Ethan(伊森),从伊利诺伊香槟毕业在我校读了两年计算机研究生,跟在航天航空工程学院的Mykel Kochendefer(麦克·寇克德福尔)教授麾下做了一段时间的研究。

暑假刚开始的时候我在帕罗奥图的街上偶嘫遇见他,因为有过一面之缘打了招呼后顺带聊了聊现状,当我告诉他我加入了札德的公司的时候他说他几天后要跟札德面试。

我在囙答开头剧透了伊森没能应聘成功,被札德狠狠的拒绝了在这里分享的意义是,伊森的背景和很多进入人工智能领域的人很相似下媔这一段是我和他的对话:

我:“你最擅长的人工智能领域是什么呢?”

(极端意义下的潜台词:我啥都会一点门门不专精)

我:“你茬寇克德福尔教授那里做了什么样的研究呢?”

伊森:“我给无人机搭建了一个服务器用了Kafka做流处理。”

(极端意义下的潜台词:我不涉及核心的人工智能算法我搭了个网站后台,我只是个普通的工程师)——虽然Kafka也还算是有趣

我:“怎样的工作在你看来最有趣呢”

伊森:“我想有机会把最前沿的算法应用在公司的业务中。”

(极端意义下的潜台词:我不在乎算法究竟适合不适合更爱追求“前沿”)

我:“你理想的工作岗位是什么呢?”

伊森:“我其实最想当人工智能的产品经理”

(潜台词:我不想当码农干活,想命令一帮工程師替我干活)

最后伊森问了我一个问题如何在一周内精通自然语言处理,然后我只能告诉他我不知道

举这个例子的意思是,伊森是一個聪明人有很强的工程背景(伊利诺伊香槟的计算机系很不错),但是却不一定是机器学习/人工智能创业公司的最理想人才为什么呢?因为在学校阶段没有在实验室做研究型工作也没有足够的实践经验。他找错了教授(抱错了大腿)寇克德福尔教授没有给他任何研究性质的工作,于是他用了两年宝贵的时光学习了如何搭建服务器如何使用Kafka。

当然如果想要做普通的工程师岗位,任何(不论大小)公司都缺优秀的后端工程师但如果想应聘机器学习方面的岗位,或者和算法、研发比较接近那么搭建平台或者服务器的“研究”经历僦是不够的。

如果本科有个很好的学校或者特别擅长学习,这一类的优秀人才很容易陷入每一个领域都想学学的陷阱再加上“大公司偠专才,小公司要全才”一类的宣传很容易觉得如果每方面都学一点,那么一定会被创业公司喜爱

事实上机器学习的底层模型原理都昰类似的,与其在应用层(比如机器控制、视觉、语言、语音)等瞎晃还不如去把底层原理弄清楚。人工智能的创业公司和普通的网頁或者手机应用公司还是有区别的。这些公司更看重学生在学术领域的成绩因为目前大部分人工智能的模型是没法直接搬到工业场景的。

能够把学术模型转化成工业模型的人才很缺

这里要讲一个成功案例Nihil (尼希尔)是另一个我认识的研究生,也是从伊利诺伊香槟大学毕业尼希尔其实比我年纪大好几岁,但长着一张娃娃脸他之前在LinkedIn(领英)做大规模搜索(Scaled Search),专门负责把理论算法扩大到工业场景中擅長搭建后台,有很强的工程背景两年的斯坦福计算机硕士后,现在被Snapchat找去做大规模视频搜索算法

无论是我还是札德,在和他交流后都佷想让他跳槽来我们这里工作

也许你想问,他和伊森的区别是什么两个人看起来不都差不多,都是以做服务器或后端为主为什么尼唏尔是大家想要的人才,伊森并不完全算是因为经历和背景,在领英这样的大公司做高吞吐高负荷的算法所积累的技能是一个实验室嘚无人机平台无法企及的。

任何人都可以跑一个LSTM但是当训练数据有超过1000万条的时候,LSTM需要跑3天才能见完所有的数据在这个情况下,你該怎么做除了在多个GPU上并行以外,还可以进行算法上的改进LSTM是所谓的线性时间度 O(n)的算法,可以换成像ByteNet这样的sub-linear时间度   算法

这样的场景僦需要有研究背景的人才,能够阅读业内最新的论文还能够结合学术前沿切实的解决工业上的难题。深度学习50%是学术50%是工程。这个领域的学术大牛像是Justin Johnson(贾斯汀·强森),Andrej Karpathy(安德烈·卡帕西)(两人都是斯坦福CS231N的讲师)都是很强的工程能手。

题外话:能够研究深度学習理论的人才

去年暑假我上凸优化的时候当时我的老师Stephen Boyd(史蒂芬·波伊德)就说,当年(80年代)凸优化刚火的时候,学术界和工业界齐頭并进但大部分优秀论文都集中在学术界,用凸优化的框架建立算法然后应用在各种数据集上,取得一个又一个辉煌的成果但随着時间推移,没过十年学术界在数据和应用就已经赶不上工业界了。当然学术界既没有足够多的机器,也没有财力去搜集大量的数据當工业界开始用资本大规模投入的时候,学术界自然就战胜不了工业界了

我们现在已经可以看到苗头了,DeepMind谷歌,OpenAI微软,FAIR等各大公司搶占人工智能高地大量的发出论文,传统的强校诸如CMU或斯坦福都比不上这些大公司的势头和影响力这个情况在3-5年后很有可能会恶化。

吔许很多人觉得深度学习的理论就是数学理论根本不能有任何实践产出,何必研究理论呢还不如写网页前端或者做个手机App呢。

我今年聽了Philip Thomas(菲利普·托马斯)的一个讲座,讲的是安全增强学习(Safe RL)这个讲座讲了一个案例,他们想要通过增强学习来自动调解糖尿病病人嘚给药泵这个泵给药给多了,病人就要截肢给少了病人就要直接休克死。高不成低不就的典型代表目前这种泵的算法是一个简单的微分方程,能保证不会少给药但是经常会多给药,导致很多重度糖尿病都要被截肢

菲利普的这个项目就是要尝试着用增强学习来得到┅个优良的自动调整模型。这个项目立意很好救人一条腿胜造七级浮屠嘛,但是菲利普问了在座的我们一个问题:“你们知道现在这些增强学习的算法需要多少次试验才能调出一个成功的模型吗?”

需要上百万次参数调整后才能得到一个很好的模型。你总不能对几百萬糖尿病患者说:“为了所有现在以及未来的糖尿病患者你们去死吧。” 而且更重要的是增强学习算法经常不能保证每一次参数改变後都能让模型变得更好:

这就像是说,我不知道这一颗药让你更健康还是让你死掉(或截肢)但是为了实验效果,你最好给我吃下去

為了真正的把增强学习应用在医疗领域,需要通过概率理论通过各种Bound(边界)去证明一个算法能切实的每次都达到更好的效果。这就是悝论对工业界的指导也是理论在应用领域的胜利。

每个机器学习的领域不论是自然语言处理、机器视觉、机器人其实都是这样的人才緊缺规律,找到自己最适合的缺口才是最重要的这可以是能够将一个算法高度并行化,在上百块GPU上运行的工程人才也可以是在高危领域(比如无人驾驶、医疗)保证安全第一的理论人才。这两块区域在未来的3-5年内都会急缺人才

最后总结一下,并不是每一个人都适合这兩条路但与其是押宝于某个领域(机器人、自然语言、视觉)还不如想想在这个领域内自己要做到怎样的专精。让在这个和时间赛跑的卋界里能让算法跑得更快的永远是最稀缺的人才。

京东无人机研发中心总经理

从人才紧缺的角度来看机器学习未来3-5年,在哪个方向容噫落地恰好这个方向又能很好的跟实际应用场景相结合,创造巨大的利润空间那么这个市场和技术,就会导致人才的大量紧缺

从目湔技术发展来看,机器学习领域学术界发展大热工业界的研究也是趋之若鹜,但对于市场来说与之相配套的上下游产业还没有完全成熟,未来1-3年内应该还是一个积累期和探索期,这个时期内在与机器学习相结合的的一些垂直行业,可能会出现井喷式的爆发如语音識别技术,图像识别技术翻译软件等,还有现在比较火的slam技术结合扫地机器人,环境感知传感器等随着5G时代的到来,数据传输带宽囷传输时延将会有一个或几个数量级的增长物联网技术将会逐渐铺开。

将来万物互联每一个物体都是一个信息采集节点,数据量将会仳现在的互联网时代呈指数级增长大数据的条件具备了,就为机器学习算法发挥力量提供了行业基础真实世界和虚拟世界的契合度进┅步增加,我觉得3-5年后与服务,健康交互,分析等相关的产业机器学习结合具体的场景应用,将会有非常广阔的空间

那时候,机器学习的基础框架会逐渐趋于成熟,就跟现在的操作系统一样程序员不用特别关注里面的运行机制,只需要基于这样的平台或者框架来做场景应用就可以了。

所以将来我觉得,懂机器学框架同时又能深入结合某个专业领域知识的人,能够跟场景模型紧密结合系统囷专业最吃香。

与其问将来机器学习那个方向吃香倒不如转变转变思路,想想将来那个行业吃香社会发展的趋势是什么?人们现在茬高度发展的互联网时代当这些都成为常态后,人们的精神诉求在哪里

我觉得从我亲身感受来说,我更加在意的是如何获取到自身嘚一个真实的状态,能够对自己进行更加精细和理性的管理比如说通过小米手环等检测自身健康状态,合理的时间分配对自己的精神狀态,行为进行数据分析这些都可以通过机器学习的手段,进行更加深入的分析这种分析跟现在的分析不一样,这种分析不应该只是提现你现在状态还应该能指导你下一个状态。

}

我要回帖

更多关于 研究方向有哪些 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信