返回主站|会员中心|保存桌面|手机浏览
普通会员

上海迅柏市场咨询有限公司

主要业务是市场调查研究,公司业务覆盖范围以上海为中心,覆...

迅柏公告
上海迅柏市场咨询有限公司成立于2014年8月8日,公司主要业务是市场调查研究,公司业务覆盖范围以上海为中心,覆盖全国300个以上地级市及部分县城。公司注册三年以来,每年业务营业额逐年稳步上升,年均营业额在三百五十万元以上。上海迅柏以“真实、客观、高质、高效”为经营理念,以“质量第一,诚信为本”为宗旨,高质高效为客户提供调研服务。
联系迅柏
  • 联系人:冯珠玲
  • 电话:021-56292620
  • 邮件:15000193136@139.com
  • 手机:15000193136
  • 传真:021-56292620
荣誉资质
友情链接
首页 > 新闻中心 > 沈浩:两个阿尔法狗下围棋,重点不在输赢
新闻中心
沈浩:两个阿尔法狗下围棋,重点不在输赢
发布时间:2017-07-01        浏览次数:25        返回列表



627日,由财视传媒、传播达人汇主办的2017全球大数据传播大会在京举行。

中国传媒大学新闻学院教授、大数据挖掘与社会计算实验室主任沈浩博士出席大会,并发表以“大数据时代的可视化传播”为主题的演讲。

甫一开场,沈浩跟现场观众分享了一个他非常喜欢的视频,一个人形机器人在跟著名主播聊天,主播问它,你有灵魂吗?它说,我思故我在。他以此来解释大数据通过语音识别对语义进行理解,形成丰富的知识库。

提到大数据领域最热的人工智能,沈浩举例,两个阿尔法狗下围棋,输赢不重要,重要的是它们要把所有的棋谱路径都走完,互相训练生成的对抗神经网络。

沈浩表示,深度学习技术会是一种新的算法革命,这种算法革命实际上得益于大数据的基础发展。

作为中国传媒大学新闻学院教授,沈浩还提到大数据在新闻业的应用。他透露,中国传媒大学最早创建数据新闻专业,今年第二次招生有4000多人报名。数据新闻是基于数据去发现新闻的一种模式,新闻后面的那些受众并非都是博士、硕士,要让人们瞬间理解大数据所呈现的东西,也是大数据的应用情景,很多人不做大数据,但是能理解大数据。

他应用自己为新书《爆发》所写的推荐语:这是一个令人兴奋的时代,也是一个大数据的时代,数据科学让我们越来越多地从数据中观察到人类社会的复杂行为模式。以数据为基础的技术决定着人类的未来,但并非是数据本身改变了我们的世界,起决定作用的是我们对可用知识的增加。

沈浩提到,人类行为的93%是可预知的。微博等社交媒体重塑了用户的社会关系,基于社交媒体的社会关系重构,让每个人的行为特征得以被追踪。

沈浩还提醒用户,微博转发不要太随意,理论上能够知道任何一个人转发和传播过程中的角色、位置和作用。利用大数据建模技术,他曾分析过雅安地震时在中国红十字会微博下面大量让它“滚”的用户,因为想知道什么人在说“滚”,有没有什么团伙。


 

他把大数据分成四个领域,一是数据科学,其中有人们关注的文本挖掘技术、情感挖掘技术、语义挖掘技术;二是网络科学,特别是人与人链接在一起的社会网络或者是复杂网络;三是空间地理科学的发展,特别是在GIS和智慧交通、智慧城市的发展上;四是可视化技术,数据、信息、交互等方面的可视化。

最后,沈浩总结道,大数据领域有一种说法叫软件定义一切、数据驱动未来、算法统治世界。而媒体现在会说,软件定义媒体、数据驱动新闻,算法重构人们挖掘新闻事件的渠道。如何从海量的数据中寻找隐藏在数据中的模式、知识和相关性,都需要更好的数据洞察能力。

 

附沈浩演讲全文(经财视media 编辑整理):    

大家上午好!我的演讲题目是“大数据时代的可视化传播”,前段时间有一个大数据的报告,正好是一个十大最有影响力的大数据学者,我为什么想表达这样一个概念呢——因为我在传媒大学新闻学院,人家总说做新闻的、做传播的老师怎么会懂大数据呢?

我想给大家分享一个我非常喜欢的视频,一个人形机器人在跟著名主播聊天,主播问它,你有灵魂吗?它说,我思故我在。

像这样一个人形机器人它是怎么实现的呢?首先,今天在大数据支撑下,视频已经可以识别我在跟人聊天,在这个视频上,这个机器人的脸、肌肉已经有表情了。

当视频,也就是图像可以识别的时候,语音也可以识别。当语音能识别的时候,文本也就可以识别了,就能够对语义进行理解,形成丰富的知识库。

今天大数据最热的是AI人工智能,人工智能如何产生数据呢?对于文本,可以给它几百万的语料进行训练。实际上现在有一种叫生成对抗的神经网络,让两个机器人互相聊天、互相训练,这时候所有的数据是机器自己生成的。

大家想一想,如果一个阿尔法狗A跟阿尔法狗B一起下围棋,这时候谁赢不重要,重要的是它们俩把所有棋谱的路径都走完。所以这种生成的对抗神经网络,通过一个解码,一个判别分析,可以生成更多的人工智能的改变。

所以我一直感觉深度学习技术是一种新的算法革命,而这种新的算法革命,实际上得益于我们大数据的基础。

但是到底什么是大数据?媒体更热的实际上像数据新闻、ARVR,特别是现在能实现新闻或者叫机器人新闻写作。因为机器表达对某一个专业知识领域的知识图谱的建构,以及写诗,特别是新闻的东西,也许这件事情马上就会成功,特别是对中文。

这张图上,全球每个地方只要有人发Twitter就有一个亮点,我们立刻可以感知到这个社会。我用了一个“感知”,你会发现很多人不做大数据,但是会理解大数据。

大数据最能够让传媒大学最早创建数据新闻专业,今年第二次自主招生4000多人来报名。数据新闻是基于数据发现新闻的一种模式,新闻后面的那些受众不都是博士、硕士,人们需要瞬间能够理解大数据所呈现的东西,这个也是大数据的情景。

其实今天不光是我们人类所生成的数据,现在还有各种传感器在生成数据,一个街区每一个点的传感器。

前段时间有一本书叫《爆发》,当时他们请我写推荐语:这是一个令人信服的时代,也是大数据时代,数据科学让我们越来越多观察到人类行为的复杂模式。以数据为基础的数据决定着我们的未来,但不是数据本身,而是我们在数据的基础上拥有更多可用数据的增加。

人类行为的93%是可预知的,大家相信这句话吗?所以微博出现的时候,我对我的学生说,你可要好好写微博,将来你的雇主在雇佣你之前都会仔细看你的微博,由此了解你的性格、消费习惯、品牌爱好、生活方式、甚至是你的价值观。

其实微博等社交媒体重塑了我们的社会关系,对于这样一个基于社交媒体的社会关系的重构,使得我们可以更好地去感知到一个人的行为特征。

在这个过程中,我们需要大数据的各种建模技术,比如雅安地震时中国红十字会发表的一条微博,下面大量的人让它滚,我做了这张分析图,主要是想知道什么人在这里说滚,有没有什么团伙。其实我经常说在微博上你不要随便转,理论上我们知道任何一个人这次转发和传播过程中的角色、位置和作用。

左边这个图是2012年我制作的一张经典的传播路径图,这是杜蕾斯的一条营销广告叫“女性励志”,它传播以后我把它抓下来,可以看到这条信息传播非常值得解读,包含像物理学的分形理论、小世界理论、强关系、弱关系、桥连接等等概念。

我把大数据分成四个领域,一个是我们看到的数据科学,当然今天我们更关注的是文本的挖掘技术、情感挖掘的技术、语义挖掘的技术。另外两个是网络科学,特别是人与人链接在一起的社会网络或者是复杂网络。今天大数据已经带来了空间地理科学的发展,特别是在GIS和智慧交通、智慧城市发展上。比如说我们整个中国,当然包括整个全球,每一条公路,每一条自行车道,我们该如何获得这些数据呢?当然大数据有一个很重要的特征,就是要看得见。

这里第一张海报是在图像识别技术中可以立刻搜出所有跟这个海报形式差不多的图像,这时候个性化推荐完全不再需要用户的信息,完全基于海报的形式。右边是我根据拿到上万个烟草盒的图片,敲定一个图片的种子,它可以找到和这张图片一样模式的,这是深度学习,基于网络图像识别技术,给人一种非常兴奋的感觉。

前段时间我把特朗普的性格分析了一下,基于他的需求、价值观、社会行为和130种消费行为特征,我们可以构建出特朗普的团队行为。还有世界各国政要的性格分析。从这一块看特朗普在结构上非常稳定。其实我们今天也可以分析任何一个人在微博上的性格特征,当然也包括给消费者打标签。

实际上我们可以不断的追踪这种比较大量的比特币的交易网络,追踪它的交易时间。其实对于移动电信大量的发红包过程,如果我们拥有这个数据,我们可以从网络科学的角度追踪其整个发展的脉络。

当然今天我们也可以对任何一篇新闻稿,通过自然语言的实体命名,抓出来这些人与人之间的关系。我们可以解决谁对谁,在什么时间,什么地点,发生了什么重要的事情,我们正在做一个全球新闻事件。当然我们愿意做全球新闻事件助力“一带一路”,监控全球每天发生的新闻事件,关注它发生的地理位置,报道之间的逻辑关系,看到这个社会的热点,去监控这个世界所发生的一些事情。

包括通过自然语言的处理,我们也可以给一个人打上标签,几个字你就知道我是做什么的。我们可以用少量的关键词代表一篇文章、一个人的语言表征。基于这些关键词,我们可以找到同样的文本,实现新闻的自动分类。当然我们也可以对各种事件进行相应的自动聚类分析。

我们也可以做一些可视化的东西,以更好的方式去呈现形态,我们通过算法可以立刻圈出这些人在什么地方,将来在重大事件安全中,我们可以监控谁在二环内,谁在三环内。

这个图是我做的,上海基于这个点上,可以把城市基于这个位置上的时间以及它覆盖的商圈分析出来。而这样一个过程是蜂窝化的,因此如果城市蜂窝化、网格化,那么管理就可以精细化,我们可以在这样的网格上更精细地去部署多少警力、多少选址或者多少个麦当劳等等。这样一些实时的运算,基于地理空间的信息,我们可以获取各个小区,甚至建筑楼宇,也可以看到人群在这些环境中的活动范围。

当然,大数据中很重要的一点是,我们需要实时感知信息的脉络,所以我们提出大数据需要有舆情作战室、有大数据的驾驶舱,这些就对今天的我们提出了更高的要求。

所以在这里做一个总结,实际上在大数据领域有一种说法叫“软件定义一切”,数据驱动未来,算法统治世界。但是今天用在媒体领域,我们会说“软件定义媒体”,数据驱动新闻,我们基于数据可以找到新闻事件,挖掘线索或者新闻本身,当然算法重构渠道,例如今日头条等等,这些都可能在未来带来更多的发展。

这是我给大数据时代这本书写的推荐语:大数据时代已经来临,我们如何从海量的数据中寻找隐藏在数据中的模式、知识和相关性都需要我们拥有更好的数据洞察。谢谢大家。

分享按钮