人脸分析：数据时代的“新玄学”-大数据文摘的财新博客-财新网

作者：涂子沛

在难得的饭后闲余，我偶尔也关注一些娱乐新闻。我注意到，最近国内外公众人物的“人设崩塌”频率堪比Facebook的数据泄露。

谁能想到素来以稳重成熟形象示人的“大叔”吴秀波，私情会如此泛滥；眉清目秀的张雨绮，“暴力倾向”似乎就没收敛过；外形俊朗、才华横溢的《银河护卫队》导演詹姆斯·古恩，竟有恋童癖好，最终被迪士尼开除。

“看脸”的时代，百年名校也未能幸免。近日，网上爆出南开大学进行了一项关于银行行长面部宽高比（fWHR）的研究，结果发现，行长的面部宽高比影响银行绩效，脸越宽的行长，银行绩效越好。

这篇文章的截图在诸多微信群里引起了群嘲式的讨论。如果这真是科学，那未来银行行长的选拔和招聘，是不是要首先量一量脸？大数据分析跟民间的看相算命之术又有什么分别？大数据时代的人脸分析，是不是已经成为一种玄学？

我不禁想起中国古人的一句话：“知人知面不知心”。很多时候，就算是一些低头不见抬头见的身边人，恐怕我们也不敢说真正了解。

我想，现代人脸识别技术十分精湛，摄像头布局在城市的各个角落，还有无数“有意”“无意”时时刻刻在记录的个体化工具，从面到面的精确识别，包括表情分析等技术正在改变和约束我们的日常行为，如果真的能够通过人的面部特征和表情分析，去撕开极具伪装的“面相”，判断其真实的内在，这将对人类社会和我们的生活产生怎样的影响呢？

从面到内：充满偏见的面相学

19世纪中叶，美国著名颅相学家塞缪尔·R·韦尔斯在他的畅销书《观相学》一书中讲过一个小故事：库比赛到其朋友德兰戈斯的房子参观，他在一位女性的画像前驻足良久，他对德兰戈斯说：“这个女人很漂亮，对吧？”“确实！”德兰戈斯回答道，但库比赛接下来却断言说，“她有魔鬼一样的心，她一定是个坏女人。”

令人惊讶的是，这幅画像画的真的是一位臭名昭著的囚犯，她的残忍和她的魅力一样闻名遐迩。

有关面相学的论调和实践最早可以追溯到古希腊。《亚里士多德全集》中曾以拉丁文形式收录其面相学论文《Physiognomonica》；西汉《礼记》也曾记载人眼位置与其本性之间的关系；宋代相书《麻衣相法》更用人的面貌、五官、骨骼、气色、体态和手纹等推测吉凶祸福、贵贱夭寿。

16世纪的意大利博学家戴拉·波塔力在作品《De Humana Pyhsiognomonia》（1586）中首次系统地描述了人的外貌与性格的映射，将人的个性与自然界的形态进行对比，认为独特的表征标志着某种真实的心性。比如一个虎背熊腰的人，他的性格可能也非常鲁莽，用低沉的声调大叫的人是目空一切的，他的原型像一头驴。

在西方，将面相学科学化的尝试一直没有断过。18世纪到19世纪初，面相学被瑞士作家、诗人拉瓦特（Johann Caspar Lavater）的四卷论著推向高潮，拉瓦特继承并发扬了波塔的思想，他认为“面相学分析的是人格的外在表达形式”：鼻子代表灵敏，脖子代表灵活，下巴意味着淫荡……他的面相学著述在英国和德国地区广为流传，吸引了那个时代的知识分子和大众眼球，甚至差一点耽误了达尔文提出进化论。

1831年，放弃神学研究的达尔文来到小猎犬号面试随船自然学者，就因为“面相不好”被冷落。当时的船长——气象学家、水文地理学家、英国海军中将菲兹罗伊读了拉瓦特的书、自认为懂得面相识人，对达尔文的第一印象很糟，他判断达尔文的鼻子形状长得不好，认定他是一个经不起折腾没有恒心的人。

到了19世纪，意大利南部因国家暴动而陷入混乱，劳工维勒拉因盗窃被判入狱，死于意大利北部的一家监狱。现代犯罪学之父隆博索（Cesare Lombroso）医生在用精密仪器分析其遗体之后得出结论——像维勒拉这样“头骨存在凹陷”“面部不对称”的“返祖之人”，具有“天生的犯罪倾向”，也就是说犯罪行为可以被代际遗传。

而在东方，面相术则一直在大师和骗术两个极端摇摆。19世纪后半叶，晚清名臣曾国藩著写《冰鉴》，基于情态、气色、须眉、声音、五行、阴阳等中国传统元素，系统介绍了面相识人之术，将人的五官形态与人的个性命运对应挂钩。

他在《须眉篇》中写道：“目者面之渊，不深则不清。鼻者面之山，不高则不灵。口阔而方禄千种，齿多而圆不家食。眼角入鬓，必掌刑名。顶见于面，终司钱谷：此贵征也。舌肥无官，橘皮不显。文人有伤左目，鹰鼻动便食人：此贱征也。”不知道，曾老先生每日起床梳洗时，又是怎么看待镜中的自己的，会不会由衷地感叹一声：好面相？

到了20世纪，更精细的数据开始进入面相学。1927年，美国纽约皇后区的一名家庭主妇Snyder伙同情夫杀死了自己的丈夫。在审判过程中，法院请来了一位面相专家对Snyder的脸进行分析，专家用游标卡尺对其五官进行测量之后，得出结论说：“她的下巴像猫一样尖锐，说明她具有背叛和忘恩负义的人格特征；她的面部表情说明她有一种寻欢作乐者的肤浅，惯于沉溺于无限的自我放纵，这种放纵最终会终结在欲望和血腥的狂乱之中！”这个结论曾经引起过全美国的讨论，最后Snyder成为了纽约市第一个被送上电椅的女性。

20世纪以来，在其他一些需要观察人脸、性格评估的领域，面相学甚至还被披上了“科学”的外衣。例如，莫顿研究所（Merton Institute）就使用面试者的面相特征去为AT&T这样的大公司提供招聘评估服务。

但无论面相学如何变形，它的核心要义是不变的：利用面部特征去判断内在，再从相似的表征去得到类似的内在判断。这离不开大量的经验和对比总结，例如我们遇见一个浓眉大眼，声如惊雷还有着宽广脸庞的男人，会下意识地想到他大概是和腾格尔一样粗犷的人，我们对腾格尔的印象会迁移到其他具有相似特征的人身上。我认为面相学不论被包装得多好，都摘不掉“伪科学”及“科学种族主义”的帽子，因为它既无法证实，也无法证伪，在每个人的表征之下，其实都是一只“薛定谔的猫”。

从数到内：现代算法的读心术

莎士比亚有句名言常被引用：“一千个观众眼里有一千个哈姆雷特。”但是，在算法的眼里，哈姆雷特只是一个属于某一类别的人，一千个算法里，只能容下一个或者几个哈姆雷特。

2016年，上海交通大学研究者Xiaolin Wu 和 Xi Zhang使用四种分类器（逻辑回归、K临近值、支持向量机和卷积神经网络）及特征生成机，对1856张人脸照片进行犯罪倾向分析，通过抓取眼内角宽度、鼻唇角角度、嘴角弧度等面部差别性特征，证明了卷积神经网络能较准确地分类犯罪，正确率达89.51%，而且犯罪组的面部特征显著异于非犯罪组。

然而随后，也传来各领域专业团队的质疑之声，包括Google数据团队、华盛顿大学生物学教授组等，主要质疑点包括：照片来源缺乏透明度、无法将表情与面部特征区分、没有进行女性的分析等。两位研究员后来也表示：“我们的研究仅仅是对脸部的社会心理感知，而对于人工智能算法预测的这些感知本身的有效性如何，我们的研究并没有任何结论。”

因为密集的数据正在产生，算法正在学会“读心”“猜人”。

2017年7月14日，莫斯科郊外的一栋办公大楼里，俄罗斯总理梅德韦杰夫与其他俄罗斯内阁成员正认真聆听精神科临床教授MichalKosinski的研究分享。

这位来自斯坦福大学的36岁青年教授，研究领域包括了技术、人工智能及大众心理，据说他在剑桥读硕士期间的研究成果——用户在Facebook上的良好活动行为与个人品性之间的关系研究，甚至启发了赫赫有名的政治数据咨询公司——剑桥分析（Cambridge Analytica），而后者就是利用了Kosinski的研究成果去帮助特朗普成功入驻白宫。在我的新书《数文明》中，我详细地阐述了剑桥分析如何用大数据结合心理学解读大众的心理、引导美国选民的投票。

就在俄罗斯之行的几周后，Kosinski就发表了那篇饱受争议的论文《深度神经网络比人类更能准确从脸部影像判别性取向》。该论文用神经网络分析了35326张交友网站照片，包括18~40岁之间的17641名男性和17685名女性，结果判断男性和女性是否为同性恋的正确率分别高达81%和71%，而当同一个人的分析照片达到5张，正确率可达91%和83%。

不过这项研究也因为研究过程的不严谨饱受诟病，包括照片选取是否中立、算法评测方法是否有效、Kosinski是否用过自己的照片进行测评等。

面对质疑，Kosinski的态度也有所转变，承认“想要核实研究结果的正确性，我们还必须进行更多的研究”。

还有人发现了独特的视角。2018年4月份，SabrinaHopper、TobiasLoetscher等四位研究者合作了一篇名为《从日常眼球运动预测个人性格》的论文，针对面相学进行了更加细致入微的研究。他们通过跟踪42名参与者的眼球运动，搜集了大量细微的眼球运动数据，再利用随机森林和决策树算法，成功预测了五大人格（OCEAN , Gordon W.Allport , 1897~1967）特征中的四个（神经过敏型、外向型、愉悦型和负责型）。

数据可靠地揭示了眼球运动与个人性格之间的强相关关系，而且搜集过程来源于被研究者的日常生活，摆脱了实验室搜集产生的环境干扰。论文的结论说明，在无约束现实环境中，人的眼球运动完全可以预测他的人格特征。但论文也存在缺陷，主要在于它的实用性还不足以投入现实场景应用，同时由于数据样本有限，也影响了预测结果的扩展范围。

我认为，不论这些学者的研究结果多么漂亮，但都离不开两个关键问题。

其一，样本的选取质量都非常糟糕。Kosinski的研究中，大量样本采集于社交网站，这就带来一个问题——无法排除照片发布者的交友需求主动性，也就是说，男性可能会公布更具雄性魅力的照片，而同性恋者公布的交友照片可能会更加阴柔。而眼球预测人格的研究同样不靠谱，总共只有42名参与者，5大人格分类又极粗糙，篮筐越大，投篮命中率自然就越高，这样的相关性本身并不科学。

其二，不论这些研究用了多么巧妙、先进的技巧和设计，都无法摆脱来自算法的“偏见”，这个“偏见”可能来自样本本身，也可能来自研究者本人的特征选取。

因此，跟“以貌取人”类似，算法也是戴着“有色眼镜”来看我们的内心的。

傲慢与偏见：人与算法的共性

在言必称数据的时代，人们不但对自己的同胞带有偏见，数据也可能产生偏见。很多人认为，从数据得到的结果就是科学，就是客观，就是实实在在的证明和依据。这种唯数据至上论，唯数据可信论，其实就是一种“偏见”。

我们要记住，数据就像比基尼，永远只给我们揭示部分事实，所谓的大数据，再大也只是世界的一个侧面。

算法会产生独到的偏见。比如，亚马逊的招聘AI算法就更偏好具有男性特征的简历，而对女性面试者不友好，因为在算法的训练数据中，男性要多于女性。美国法院使用的人工智能程序也对黑人的再犯罪判定具有偏见，认为黑人的再犯罪可能性是白人的两倍，从而影响法院对不同人种的刑期判定；在金融风控方面，AI算法的结果也对人的种族、阶层存有偏见，比如，深色人种即使品行端正也很难申请到住房贷款，因为算法会将他与那些大多工作不稳定且有犯罪前科的深色人种归为同类。

产生偏见的原因在于，算法对人的认识几乎是即时的，没有时间维度。也就是说，只要我们的特征维度不变，那么同一个算法永远都会将我们归于固定的某一类，问题是人某一个时刻展现的只是自己的一面，更重要的是人是在不断发展变化中的，青年时期、中年时期、晚年时期，可能呈现完全不同的风格。为什么人识人就不会这么刻板，是因为人对人的认识，是一个缓慢的、渐进的、主观的、挖掘的过程，时间会不断修正初始的看法和认识，因而人对人的评价会逐步趋向客观和真实。

努德海文（Nooderhaven）的人性内核分裂模型，将“信任”加入到“经济人假设”中，认为随着人与人之间交往与合作的次数增加，“信任”的成分将会越来越大，最终人与人之间的偏见将会随着信任的增加而软化。

回到前面的故事，达尔文因为“鼻子长的不好”，引起菲兹罗伊船长最初对他的不满，但后来菲兹罗伊也逐渐认可了达尔文，虽然两人时有冲突，但菲兹罗伊还是支持了达尔文后续的科学考察。

对此，达尔文曾在自传中写道：“我的表现与通过我的鼻子做出的预测相反，对此我很满意”。达尔文后来专门搜集了各类人种的几千张人脸照片，著书立说反驳面相学。

算法就像一个成长的婴孩，人类用源源不断的数据去喂饱它，它学会了下棋、学会了对话、学会了分类、学会了预测、学会了观察还学会了人类的偏见。

显然，算法无法理解“形相虽恶而心术善，无害为君子也”，很多场景下，算法无法做到“无偏”和客观公正，大数据追求的是相关关系，而非因果关系，就像我们开篇提到的南开大学那项研究，脸宽的银行行长银行绩效好的概率会比较高，因此脸宽和绩效之间呈正相关关系，但绝非直接因果。

在大数据分析中，我们可以看到一种趋势，一个结果，这就如同照镜子，你和镜子里的人只存在相关性，即使开枪把镜子打碎了，人也没事，如此而已。过分强调因果，只会催生数据时代的“新玄学”，这才是百年名校上热搜的原因所在。

如此说来，我们虽然体力不如动物，脑力不如算法，但我们作为文明的创造者，我们天生的动物本质和主观能动性仍将在数文明的时代熠熠生辉。

说到底，人心难测，并不是什么坏事，数据和计算如果是万能的上帝，有什么疑问只有咨询一下电脑，那哪里还有诗歌、小说，电影，想象、爱情的生存空间？没有了恶，善良就不会那么宝贵，没有恨，爱又有多少滋味，一个循规蹈矩、按部就班的世界，又会有什么意思呢？

作者：涂子沛，著名大数据专家，阿里巴巴集团前副总裁，著有《大数据》《数据之巅》《数文明》数据三步曲。

大数据文摘经授权转载自虎嗅APP

话题：