「诶,你跟我前女友长得挺像,我差点认错」
男生搭讪女孩,总有人用这种烂俗套近乎招数,整得大家仿佛很熟,仿佛很有缘分(手动狗头)。
当然,不止现实搭讪,长得像「异父异母亲兄弟姐妹」这件事,从来是网上玩梗打趣的热门话题…
比如,林东临和郭俊杰…
不光你我关心,这事儿被科学家拿来当成了研究问题,还有了结论:
相似长相的人确实「有缘」,他们可能有相似DNA。
最新一份发表在Cell子刊的文章显示,面部相似的人共享着相同基因序列。
这结论他们怎么得出的?靠谱么?
一起来看看。
请机器来找「异父异母的亲兄弟」
首先要找一堆长相几乎一模一样的人作样本。面对全球70亿茫茫人海,怎么找是个问题。
科学家找到了加拿大艺术家弗朗索瓦布鲁内尔 (François Brunelle)。从1999年,这位艺术家就在全球收集相似人相。
靠着「找对门路」,科学家获取了32对长相酷似的样本,并请参与者提供了详细的生物特征、所在地及生活方式问卷。
为保证脸部比对更客观,科学家找来三种算法/模型,共同「拆解」脸部细节,判断相似度。
其中包括了——
(1)自定义深度卷积神经网络Custom-Net,一种来自AI公司Herta,主用于监控领域的CNN模型;
(2)应用在Matlab上,常用于面部分类任务的MatConvNet;
(3)来自微软Azure的Microsoft Oxford Project人脸API,常用于面部分析;
这些模型内置数百万参数,且历经上千主题下的数百万张面部图像训(折)练(磨),能识别姿势、发型、表情、年龄、配饰等诸多特征,对相似图像,模型将给出从0到1的一个相似度区间。
如果机器们三方「会审」一致判断极为相似,那科学家就会将样本作为重点研究对象。最终在32对样本中,有16对被三方认可。
之后是DNA比对环节。
科学家利用一种名为单核苷酸多态性 (SNP) 的基因特征,比对各组长相高度相似人的唾液内DNA样本。
此后,再通过无监督聚类热图检测,让机器判断每对DNA是否属于一个类型(即相似)。
结论有点因吹斯汀
结果显示,在16对「被机器全部认可」样本DNA中,科学家发现,有9对被聚成一类,他们在3700个基因中,共享了超过19200个SNP。同样,在K-means算法中,最终结论也类似。
此外,科学家还研究了相似配对的生物特征及生活方式。他们在体重、身高、是否吸烟、教育水平等方面也在配对组中相互有关联,这说明,共享的遗传变异不仅影响长相,也造成相似的行为和习惯。
研究者形容该结果十分「striking」。研究者还排除了近亲关系的可能,并发现,这些样本比长相不同的双胞胎,基因相似度更高。
更有意思的是,剩下16组未通过三方机器视觉特征认可的样本中,也只有一对样本DNA被聚类在一个集合。
在人种和地域方面,科学家还进行祖先溯源,他们观察到,几乎所有相似配对样本的祖上生活地区都很靠近。
但需要指出,本文主题在其他多组学研究中,却有着不同结论。
比如DNA甲基化模式下,16对高度相似样本只有一堆匹配;
再比如从微生物角度看,16对相似样本中,口腔菌群相似的仅一对,且这对样本通过SNP也没被聚类到一起。该领域有研究认为,口腔微生物相似度与皮下脂肪有关,可能导致相似长相(如:脸上肉多)特征的人,有相似的口腔微生物特征。
团队介绍
本文一作Ricky S. Joshi,计算生物学家,来自西班牙巴萨罗那Josep Carreras 白血病研究所 (IJC),研究方向主要为遗传学和表现遗传学,其个人页面显示,Ricky致力于发现人类基因组中的病理性变异。
二作Maria Rigau ,同样Base在西班牙,是巴塞罗那超级计算中心 (BSC)的博士,专业为生命科学,主页头像显示,这是一位蛮喜欢狗狗的女研究者。
One More Thing
有网友指出,马斯克长相有点像爱迪生,还Po了下面这张图——
不知你怎么看?(手动狗头)
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”