每天通勤节约5分钟,城市会发生什么变化
文/程一祥
如今,我们每个人都在谈论“数据科学”,哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学领域的科学家、从业者们又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在年走访50位来自各行各业的顶尖数据科学从业者,希望能让你们了解这些神奇的人和他们神秘事儿,为你们一窥数据科学的未来与未知。
大数据、人工智能、无人驾驶、区块链,技术浪潮总是一波未平一波又起。风口中,一个数据科学家该如何选择。阿里云机器智能科学家闵万里为DT君讲述了他的故事。
当“少年班”不再是少年
春节过后的杭州依然还有些冷,连绵的几日阴雨似乎也在阻延着人们找回工作的热情。
虽然街道上人烟稀少,阿里的办公楼里却人来人往,大多行色匆匆。他们穿行在一个又一个会议室之间,屋内的繁忙与窗外的萧瑟形成了极强的对比。
在傍晚,DT君见到闵万里的时候,他刚结束了一个部门会议——这是他今天开的第三个会了,而且晚上还有会。
(图片说明:DT君在杭州阿里云总部采访刚开完会的闵万里)
今年春节前后,阿里加速了在人工智能领域的布局。他们的明星AI产品“ET城市大脑”在一月底得到马拉西亚政府认可,被引入首都吉隆坡治堵;二月又登上网络春晚的舞台。作为阿里云机器智能科学家以及这款明星产品的主要幕后推手之一,闵万里在这几个月里,显得格外的忙碌。
如今的节奏,对闵万里来说,还真有点似曾相识:科技、曝光、节奏快。二十多年前,当闵万里走进“中国科学技术大学少年班”的时候,他就开始感受到了。虽然时间已经有点久远,但一提起“科大少年班”这个话题,关于“神童”的讨论总还是能吸引人注意。
这么多年过去了,这个群体再次以另一种方式出现在了人们的视野中。他们不再是“神童”,而是开始成为科技领域的执牛耳者。当年与闵万里一起入学的,还有如今中国科学院最年轻的华人院士庄小威、打破了华人年龄纪录晋升的哈佛教授尹希、发现世界上最小的纳米碳管的秦禄昌、发明原子陷阱追踪分析法的卢征天.......
当然也并不是所有人都这么幸运。当年媒体口中的“第一神童”宁铂后来出了家,很多人也逐渐离开了科技领域。
“其实我从一开始也就没觉得(我们)跟普通大学生有什么区别,如果非要说的话,就是课业压力更重一些。”谈到科大少年班,闵万里的话语自始至终都流露着亲切和感激,他没觉得自己有什么不同。在他心中,正是从科大开始,他开启了自己追逐数据科学的道路。
“那个时候才十五六岁啊,就要把大学本科数学系的课程全学完。每周六节课,晚上还要做实验。”对于闵万里来说,他觉得终身受益的地方,就是在少年班这个机制下,他接受了科大最系统、最严谨的数学和物理学训练。
“当时科大有一个讲线性代数的小册子,李炯生和查建国老师编的,当时堪称最难宝典。我们连那个都学下来了。那数学肯定是没问题了。”闵万里回忆说,如今能在数据科学领域取得一定成绩,离不开在科大打下的数学和物理的知识体系基础。加入少年班时,闵万里靠的是自己过人的数学天赋,在科大选专业时,他又选择了物理学作为研究方向。
在他看来,数学和物理的知识体系结合,给他后来的研究提供了自信的基础。“如今我们做数据科学,首先要梳理行业的商业逻辑对吧,这就需要用物理的思维,去抽象定位这个业务的本质是什么;抓住本质后你要有数学工具去量化它,处理庞大的数据问题,建模等。知其然,然后知其所以然,不是乱套框架。”闵万里说到。
闵万里谈到数据,总是有一种学者般的认真劲儿,和一种纯粹的理科逻辑。到现在,当他在公司里跟人讨论技术问题的时候,如果遇到分歧,他还是会说“实在不行我们就推公式嘛,算一算,看看谁是对的”。
科大毕业后,闵万里考入了美国芝加哥大学继续攻读物理学博士。如果就这么走下去,他可能会成为一个优秀的物理学家,而与人工智能擦肩而过。博士期间的转专业的决定,让他最终还是踏上了数据科学这趟高速列车。
面对选择
陶杰在《杀鹌鹑的少女》中写到:“当你老了,回顾一生,就会发觉,什么时候出国读书,什么时候决定做第一份职业,什么时候选定了对象而恋爱,什么时候结婚,其实都是命运的巨变。只是当时站在人生的三岔路口,眼见风云千樯,你作出选择的那一日,在日记上,相当沉闷和平淡,当时还以为是生命中最普通的一天。”
年,闵万里遇到了他的第一个三岔路口。
当时的美国处在互联网泡沫的前期,整个资本市场表现出了对科技狂热的追捧。“只要做个类似PPT的产品演示,忽悠一些互联网概念,就能拿一亿美元的融资。”——钱来的实在太容易了。
大环境吸引了大批优秀的校园精英投身互联网科技行业,计算机相关的专业大受追捧。据闵万里回忆,很多物理系的研究生,念了一年物理就不念了,转去再读一年CS编程,出来就能去A股公司拿十万美刀的年薪。
在当时很多学物理、数学这些基础学科的学生看来,计算机简直是太好入门了。又容易赚钱,为什么不呢?毕竟没有人非要和钱过不去。
闵万里这时去找到教授,说他也要转专业。
“你是不是也要去学计算机?”这是那位费米国家实验室的老教授看到他后的第一反应。
不过闵万里却是想转到统计系。
“完全是兴趣使然。”闵万里在研究粒子物理的两年里,接触到了大量数据统计的工作,他逐渐对统计领域产生起浓厚的兴趣。
(图片说明:芝加哥大学图书馆;图片来源:Wikipedia)
在科大培养起的数学功底,让他在统计上更加如鱼得水,也更加自信。
谈起当时的互联网热潮,闵万里说:“从没心动”,因为那从来不是他要的生活。与其说是兴趣决定选择,不如说是一种对自我认知的自信——他一直很清楚自己要什么。
“钱是迟早都会有的,但是如果找到机会做自己喜欢做的事,这个机会是难得的。”
统计就是他当时最喜欢做的事儿。
老教授用费米国家实验室专用的信纸,洋洋洒洒地为他写了一封推荐信,帮助闵万里进入了芝加哥大学的统计学系。这也是他真正开始数据科学的起点。
当“艺术”照进现实
“DataScience(数据科学)虽然现在火,但是早期并没有提,我们那时自己人都叫它DataArt(数据艺术)。”
离开象牙塔后,闵万里就迫不及待地加入了IBM。他形容自己就像是一个狙击手,“一定要上战场才行”,数据应用必须要到业界实践中去。
在对数据科学的讨论中,当时分为两派。一派是以统计学家为代表的“理论派”,他们坚信遇到问题应该先从物理本质出发,基于逻辑寻找相关性,然后设计模型,选择变量;另一派是以计算机专家为代表的“实干派”——不管基础理论,套模型先算起来,比较“暴力”地直接试。孰优孰劣,就结果看还真是难分高下。
“当时我们就觉得,这个东西应该叫‘数据艺术’,我们就像艺术家,数据就像调色板,我们要去凭空创造。”
年,还在IBM的闵万里创作了他第一个非常满意的“数据艺术作品”——利用道路交通的摄像头和传感器数据,预测新加坡中央商务区未来60分钟里的交通状况,从而避免交通拥堵,准确率高达85%。
他的灵感,来源于读博时研究的网络随机过程课题。闵万里创造性地运用统计学和物理学的方法,解决了一个交通的工程学问题。这项研究的直接价值在于,通过这套算法,只需要调整一些红绿灯设置,就能够一定程度避免大城市的交通堵塞问题,每天可以为每个人节约5-10分钟的通勤时间。
“这是多大的生产力价值!”闵万里感慨地说,“我当时觉得,自己的公式终于没有白推,还是挺幸运的。”
闵万里的时任老东家IBM却想的比他更多。
年11月,IBM在美国纽约发布了《智慧地球:下一代领导人议程》主题报告,其中正式提出了“智慧地球”的概念。这个概念后来被称为“智慧城市”,简单来说,就是应用信息技术等高科技更加精细、动态、科学的管理我们的城市,解决城市发展的诸如拥挤、堵车、污染等问题。
(图片说明:IBM的“智慧地球”计划;图片来源:IBM
转载请注明:http://www.abuoumao.com/hykz/2611.html