财新传媒
位置:博客 > 大数据文摘 > 文章归档 > 2018年10月
2018年10月31日 12:28

小心!万圣节的人群中潜伏着一个“人肉傀儡”

小心!万圣节的人群中潜伏着一个“人肉傀儡”

编译:DonFJ、Aileen

万圣节要到了,每年这个时候,非常会玩的MIT媒体实验室都要弄一些毛骨悚然的实验。

 

比如2016年的时候,他们做了一个叫“恶梦机器”的算法,可以把任何图片变成恐怖电影一般的场景。

 

今年自然也不例外。听说最近他们又在闷声搞事情!

 

与往年只是在线上调戏大家不一样,今年他们要玩点与众不同的——万圣节中的群体智能+增强现实,项目代号“BeeMe”。

从这个奇怪的名字和上图,我们大...

阅读全文>>
2018年10月31日 12:28

还在为万圣节穿什么发愁?AI给出的这份穿搭建议你敢试吗?

还在为万圣节穿什么发愁?AI给出的这份穿搭建议你敢试吗?

编译:DonFJ

聊起机器学习的时候,人们总觉得它特别的神秘。我们知道AI算法能完成一些任务,但是不知道它具体是怎么做到的。

 

严格的来说,机器学习算法是人工智能AI的一个分支,但是我们其实也可以把它当成一种预测算法看待。

 

比如根据一个影迷在豆瓣上评分的数据,算法能预测出ta喜欢什么样的电影;根据一个求职者的履历,算法能预测它这次去面试被刷的几率;或者说(重点来了!)根据过去几年里万圣节服装的订...

阅读全文>>
2018年10月30日 12:10

抓捕美国“金州杀手”的新DNA匹配技术比你想象的强大

抓捕美国“金州杀手”的新DNA匹配技术比你想象的强大

编译:M、小七、夏雅薇

今年4月,警方用一种以前未使用过的DNA技术解决了几十年前的谜团 ,金州杀手的身份。

 

具体方法是使用家族性DNA测试,这是一种新型DNA取证工具,它克服了在现有数据库中搜索样本匹配没有结果的困难,可以通过公共DNA数据库搜索到杀手可能的远亲,这将大大提高警方侦查的效率。

 

注:美国加州一个上世纪70到80年代曾出现一名连环杀手,涉及至少12宗谋杀、45宗强奸和多宗爆窃案,被称为“金州...

阅读全文>>
2018年10月30日 12:10

神经网络的叛离:32年前从心理学与生理学分离的瞬间

神经网络的叛离:32年前从心理学与生理学分离的瞬间

编译:Andy

反向传播算法隶属于深度学习,它在解决模型优化问题的方面有着重要的地位。

 

这一算法由被誉为深度学习之父的Geoffrey Hinton提出。1986年,他发表了名为Learning representations by back-propagating errors" (Rumelhart, Hinton & Williams, Nature, 1986) 的论文,到目前为止已有将近16000次的引用,可以说是一篇位于神经网络研究金字塔顶端的论文。

 

但是,学界对这篇代表反向传播算法的论文却态度...

阅读全文>>
2018年10月29日 11:53

340亿美元收购红帽 开源史上最大交易能拯救IBM吗?

340亿美元收购红帽 开源史上最大交易能拯救IBM吗?

作者:魏子敏、蒋宝尚

340亿美元!

当地时间10月28日,IBM官方宣布以此价格收购开源软件公司红帽(Red Hat)。这是IBM有史以来最大的一笔收购交易,也是整个开源市场上有史以来最大的一次收购。

 

根据一份联合声明,本次IBM收购的具体操作方式是IBM以每股190美元的价格购买红帽公司。客观来看这个价格IBM给的很公道了,因为在周五的美股市场,“小红帽”收盘价只有116.68美元。

 

这一开源史上最大交易是IBM在一片...

阅读全文>>
2018年10月29日 11:53

代际之间的技术大一统:自动驾驶汽车

代际之间的技术大一统:自动驾驶汽车

编译:朱帅、魏子敏

对待新技术的态度往往和年龄有关。一般来说我们会认为,年轻人在对技术转变的问题上会走在老年人的前面。

Everett Rogers曾在他的经典著作《Diffusion of Innovations》一书中阐述道,这种问题的分布规律通常遵循钟形曲线。也就是说,我们一般认为80、90后是属于最早的接纳新技术的一批,而60、70更多属于落伍的那一批。

 

但是,也不尽然。

 

知名调研中心皮尤研究中心(Pew Research Cent...

阅读全文>>
2018年10月26日 12:12

Science报道:中国加入全球量子计算机建设排位赛

Science报道:中国加入全球量子计算机建设排位赛

编译:小七、蒋宝尚

天河一号是我国首台超级计算机。坐落在天津的中国国家超级计算机中心。

八年前它曾是当时世界上运算最快的计算机,运行速度达到2.57千万亿浮点运算(或每秒数千万次浮点运算)。

 

自从投入使用后,在航天、天气预报、气候预报和海洋环境模仿方面均取得了显著成就。

 

超级计算机的发展也是一个国家科技实力的体现,国际上在超级计算机领域的竞争也非常激烈。

 

当然,竞争也带了进步,各国...

阅读全文>>
2018年10月26日 12:12

深度特征合成:自动化特征工程的运作机制

深度特征合成:自动化特征工程的运作机制

编译:M.Y.Love、Hope、云舟

将机器学习的方法推广到新问题仍然存在着不小的挑战,其中最严峻的问题之一,就是人工提取特征的复杂性和高时间耗费性,本文就将带你了解自动化特征提取方法。

 

机器学习算法面临的最大技术障碍就是它们需要通过对数据的处理才能够运作——它们只能利用数值型数据进行预测。数据是由相关变量组成的,一般称为“特征”。如果计算得到的特征不能清晰地揭示预测信息,那么任何参数的调整都无法...

阅读全文>>
2018年10月25日 12:01

迷人又诡异的辛普森悖论:同一个数据集是如何证明两个完全相反的观点的?

迷人又诡异的辛普森悖论:同一个数据集是如何证明两个完全相反的观点的?

编译:胡笳、狗小白、张弛、钱天培

想象一下下面这个场景。

你和你的小伙伴准备找个地方搓一顿,但在两家餐厅的选择上争执不休。

 

于是乎,秉持“数据驱动人生”的你俩搬出了小众点评网的评分数据。

 

你发现,你想去的这家餐厅的评分果然比另一家高。

 

正当你得意不已的时候,你的小伙伴宣布了TA的发现:另一家餐厅的评分更高。

 

这是咋回事呢?莫非评论网站的数据还出错了不成?

 

事实上,你和你...

阅读全文>>
2018年10月24日 12:10

斩获能源界诺贝尔奖,华人科学家“纳米发电机”解决物联网和AI发展能源桎梏

斩获能源界诺贝尔奖,华人科学家“纳米发电机”解决物联网和AI发展能源桎梏

作者:蒋宝尚、魏子敏

万物互联是个人类社会的迷人愿景,但物联网的发展一直存在一大桎梏,那就是电源

物联网世界默认我们可在任何设备上装置传感器,经由网络收集信息,但如果没有相关能源支持传感器启动,一切都是纸上谈兵。

以目前的技术,为所有传感器接上电线并不现实,为其内置电池则会导致成本上升。

 

有望解决这一问题的是“物体的自行摩擦/震动发电”,让设备自行发电,满足自我需求。这个听起来遥不可...

阅读全文>>
2018年10月23日 12:32

正在被巨大数据中心吞噬的全球电力,谷歌脸书和比特币的“源”罪

正在被巨大数据中心吞噬的全球电力,谷歌脸书和比特币的“源”罪

编译:罗然、quedy、Zhifu、笪洁琼、Aileen

将你最新的假期照片上传到Facebook,它们最终会被存放在俄勒冈州一个名叫Prineville的小镇上,这里有Facebook已经建立的三个巨型数据中心,它们还计划再建两个。

 

这些巨大的数据中心有多大呢?

 

内部空间面积超过航空母舰,成千上万的电路板一排排整齐的排列着,一直延伸到没有窗户的大厅,这里面的走廊太长,工作人员需要用滑板穿梭其中。

 

这些巨大的建筑物是信...

阅读全文>>
2018年10月23日 12:32

机器学习高质量数据集大合辑

机器学习高质量数据集大合辑

编译:蒋宝尚

在机器学习中,寻找数据集也是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。

 

那么用于机器学习的开放数据集有哪些呢?文摘菌给大家推荐一份高质量的数据集,这些数据集或者涵盖范围广泛(比如 Kaggle),或者非常细化(比如自动驾驶汽车的数据)。

 

首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:

  • 数据集不应混乱,因为你不希望花费大量时间清理数据。

  • ...

阅读全文>>
2018年10月22日 12:05

没有完美的数据插补法,只有最适合的

没有完美的数据插补法,只有最适合的 编译:张秋玥、胡笳、夏雅薇 数据缺失是数据科学家在处理数据时经常遇到的问题,本文作者基于不同的情境提供了相应的数据插补解决办法。没有完美的数据插补法,但总有一款更适合当下情况。   我在数据清理与探索性分析中遇到的最常见问题之一就是处理缺失数据。首先我们需要明白的是,没有任何方法能够完美解决这个问题。不同问题有不同的数据插补方法——时间序列分析,机器学习,回归模型等等,很难提供通用解决方案。在这...
阅读全文>>
2018年10月22日 12:05

机器学习+ICU:为重症患者提供实时护理

机器学习+ICU:为重症患者提供实时护理

编译:张驰、AIZero、毅航、涂世文

在医院重症监护室(ICU),重症患者在病床上躺着,全身连接着各种机器设备,这些机器能提供患者全天候的照顾。

 

这种先进的医疗设备原本旨在让病人“活着”:静脉注射滴入血液,机械呼吸机将空气推入肺部。

 

患者身体绑定的传感器追踪心率变化,血压以及其他重要的信息,床边的监测器以波浪线的形式记录着各种数据的变化。当机器检测到某些记录的测量值超过正常值的范围时,会发...

阅读全文>>
2018年10月21日 12:00

罗默斩获2018年诺贝尔经济学奖,Python功不可没!

罗默斩获2018年诺贝尔经济学奖,Python功不可没!

编译:蒋宝尚

当地时间10月8日,瑞典皇家科学院将2018年诺贝尔经济学奖颁给了两位在经济学上有着突出贡献的学者,一位是62岁的美国经济学教授保罗·罗默(Paul M.Romer),另一位是另一位美国经济学家威廉·诺德豪斯(William D.Nordhaus),由此表彰两位在其经济增长方面做出的接触贡献。

 

 

具体而言,威廉·诺德豪斯和保罗·罗默设计了一些方法,为解决我们时代最基本和最紧迫的问题,全球经济的长期可持续增长...

阅读全文>>
2018年10月21日 12:00

数据科学即将迎来“无代码”时代

数据科学即将迎来“无代码”时代

 

编译:顾晨波、笪洁琼、Aileen 我们正在进入数据科学实践的新阶段,即“无代码”时代。 像所有重大的变化一样,这个变化还没有在实践中清晰地体现,但这个变化影响深远,发展趋势非常明显。   现在,每一周都会有一些自动代码行业的最新进展。创业公司的集成产品是有一些进展的,不过更多见的是基于现有分析平台供应商新添加的功能或模块。   自从自动化机器学习(AML)平台出现以来,我一直在关注它们的成长。 ...

阅读全文>>
2018年10月20日 12:00

专访吴恩达:离开百度后的563天

专访吴恩达:离开百度后的563天

编译:张秋玥、钱天培

吴恩达,42岁,斯坦福大学计算机科学教授。

曾任职于世界上最大的两家科技公司——谷歌与百度,因领导人工智能工作而闻名遐迩。

 

去年,吴恩达突然离开百度,并在随后的数月内推出了三个备受瞩目的人工智能计划:一系列名为deeplearning.ai的在线人工智能课程,一家为制造公司开发人工智能项目的名为Landing AI的企业,以及一家名为AI Fund的创业公司孵化器。

 

近日,“财富”杂志(Fortun...

阅读全文>>
2018年10月19日 12:01

维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书

维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书

编译:狗小白、李佳、张弛、魏子敏

没人否认,维基百科是现代最令人惊叹的人类发明之一。

几年前谁能想到,匿名贡献者们的义务工作竟创造出前所未有的巨大在线知识库?维基百科不仅是你写大学论文时最好的信息渠道,也是一个极其丰富的数据源。

 

从自然语言处理到监督式机器学习,维基百科助力了无数的数据科学项目。

 

维基百科的规模之大,可称为世上最大的百科全书,但也因此稍让数据工程师们感到头疼。当然,...

阅读全文>>
2018年10月19日 12:01

IEEE专访李开复:五个问题直面人工智能的危机

IEEE专访李开复:五个问题直面人工智能的危机

编译:狗小白、jin、蒋宝尚

人工智能毁灭论一直是学界和业界讨论的焦点。

霍金先生前曾三番五次表态,“人工智能可能会毁灭人类”。钢铁侠马斯克曾经提出,人工智能有可能会成为人类文明的最大威胁,呼吁政府快速采取措施,有效监管这项技术。

 

但李开复希望,更多的人能够从三个方面来关注人工智能带来的毁灭性变革:全球权力的平衡、国家经济,以及人类脆弱的灵魂。

 

李开复学生时代开始,就对人工智能十分着迷...

阅读全文>>
2018年10月18日 12:00

昨天,YouTube全球崩溃超过半小时

昨天,YouTube全球崩溃超过半小时

作者:魏子敏

YouTube崩了。

当地时间下午6点左右,全球最大的视频网站YouTube遭遇了一次全球大崩溃。从手机端app到电脑链接都显示无法打开。该状态持续时间超过半小时。

 

当天晚一点,YouTube发布官方推文,确认该网站遭遇全球性中断,为用户带来的不便表示道歉。

 

暂时的中断似乎影响了全世界的用户。

 

“我们正在努力解决这个问题,一旦修复就会尽快通知,”YouTube在Twitter上发布的一份声明中表示。

...

阅读全文>>