财新传媒 财新传媒

阅读:0
听报道
作者:刘俊寰
 
10月31日,由北京智源人工智能研究院主办的2019北京智源大会在国家会议中心开幕。开幕式上,加州大学洛杉矶分校朱松纯教授、斯坦福人工智能实验室(SAIL)负责人Christopher Manning、京东集团副总裁周伯文等多名中外人工智能专家围绕前沿问题展开思想碰撞。
 
今年8月,智源研究院宣布,中国人民大学高瓴人工智能学院院长文继荣出任智源“智能信息检索与挖掘”的首席科学家,整个团队以构建面向下一代的个人信息助手为目标,进行相关研究。
 
开幕式结束后,大数据文摘对文继荣教授进行了采访。
 
近期将做一个面向北京市民的获取政务信息的智能助手
 
文继荣教授首先简单介绍了研究进展。
 
智能信息检索与挖掘这个方向实际上是智源人工智能研究院确立的第三个研究方向,主要聚焦于在如何把最新的人工智能技术应用到信息检索和数据挖掘上来。
 
整个团队经过了很多前期沟通和交流,确定了研究的中长期目标,构建面向未来下一代的个人智能信息助手。
 
目标确定下来之后,很多事情就比较顺利了。团队学者做了分工,分了四大块研究内容。第一个部分是智能信息检索的数学和认知理论基础,再往上是具体的技术和算法方面,在这里又分了三个方向。大家各司其职,已经开始相关研究。
 
谈到进展,前几天团队开了一次例会,会议上,我们进一步细化了研究目标。之前我们确定做的个人信息助手,就像斯坦福大学Manning教授说到的,这是未来人工智能研究非常大的目标。
 
回过头来,团队也定下了一个近期目标,做短期内就能看得见摸得着的东西,这个近期目标就是做一个面向北京市民的获取政务信息的智能助手。
 
现在市民去办事情,不管去网上,还是去北京市各个单位,面对他们的是特别多的信息,各种公告和办事流程,而且这些信息分布在各个地方,找起来特别的麻烦。我们希望有一个智能信息助手,专门帮老百姓办事情,比如想迁户口或者办理港澳通行证等等,市民只需要在手机上装一个APP,它能告诉你这个事情怎么办。
 
关于研究上的进展,四个研究方向或者说四块研究内容,都仍然在持续往前推进。
 
把智能信息助手能做的事想得像人一样,研究空间就大了
 
文继荣教授就政务信息助手的细节进行了详谈,他说,之所以把短期目标确定到政务信息上,是因为这些数据是可获取的,政府网站上有,政府也会提供相应的支持,有了政府的数据支持,信息孤岛等相关问题也能得到进一步解决。并且,政务信息助手的预计实现功能也是清晰的,使用者不会问出特别没边的问题,这在技术上也降低了难度。
 
尽管如此,可以想见做一个智能助手的困难程度,现在也面临着很多技术上的挑战。但经过对团队的整体评估,在短时间内能实现不错的原型系统。
 
关于智能信息助手,我们希望做得就像人一样智能,从这个角度考虑的话,每件事情都有特别多的东西要做,研究空间一下子就大了,数据也是一样。
 
智能信息助手人工智能领域中一项既重要又困难的问题,这是一个长期目标。在往这个长期目标前进的路上,就需要一些看得见摸得着的中间成果,这就是决定做政务信息助手的原因。文继荣教授表示有信心让它在两三年内落地。
 
对于智能信息助手的最终构想,文继荣教授透露,必须承认,信息检索自本世纪初随着搜索引擎发展以来,已经有十年左右没有取得重大突破了。
 
即使到了现在,信息检索还是通过关键词输入进行,当然其中也有小的改进,比如查询的时候有了推荐,排序也更精准。但如果让大家选择,大家肯定都会选择像贾维斯这样的智能信息助手,就算你不问他,他也什么都知道。
 
而随着近几年深度学习、知识图谱技术的发展,传统的信息检索方法,包括架构、核心算法,都到了应该有重大改进和突破的时候了,搜索应该走向智能化。
 
当搜索实现了智能化,很多事情都将发生深刻变化,比如交互方式,原来是输入关键词,现在可以通过对话解决,因为很多时候信息需求只有通过这种对话才能够表述清楚。
 
除此之外,可能在移动的环境下,比如说,当你路过央视大裤衩,你说那个奇怪的建筑是什么。要理解这句话,对人来说没有什么问题,但是要计算机去理解这个指代关系,就不是那么容易的。智能信息助手在理解你的时候是根据内容,但是平时用自然语言表达的时候,很多东西是省略的,只有把省略的内容补充进来,才能做到准确理解。
 
甚至,智能信息助手可以进行主动理解,比如你说,晚上准备跟朋友聚会,智能信息助手马上就提醒,是不是要定一个餐馆,是不是要注意交通情况等等。
 
随着使用的深入,智能信息助手会变得比你还懂你自己,这是可以做到的。因为人有时候不是那么懂自己的,怎么在你的助手里面逐渐形成自己的性格、人格,你的爱好,这些东西都是有大量的东西要去研究。
 
我经常开玩笑,以后我们去世了,只要把个人信息上传到助手上,就永生了,这件事情也完全可以去做的。
 
整个研发过程,每个地方都有很多东西要做,每个问题都是在人工智能这条路上关键也艰难的问题,希望我们团队花五年、十年,能够帮人类往前推进一大步。
 
而谈及近两年不少企业将重心从获取数据、处理数据转移到发展算力上,文继荣教授谈到,发展算力是跟他们业务有关系,发展算力本身是没有错的。
 
有老师说到一个公式,人工智能=数据+算力+深度学习(A=B+C+D),这是对的,过去这些年已经证明了它的有效性,人工智能必须是针对特定任务上,有大量数据的情况下进行。现在很多这样的任务都可以通过堆数据、堆算力得到解决。作为研究人员,要从理论、核心方法、算法方面寻求突破。
 
用BERT做预训练模型,当然需要堆很多数据,主要是算力,做好了在各个任务上就都会有很好的表现,但是它不解决核心问题。只是说,用了BERT会有功能的提升。
话题:



0

推荐

大数据文摘

大数据文摘

448篇文章 3年前更新

普及数据思维,传播数据文化

文章