「诶,你跟我前女友长得挺像,我差点认错」
男生搭讪女孩,总有人用这种烂俗套近乎招数,整得大家仿佛很熟,仿佛很有缘分(手动狗头)。
当然,不止现实搭讪,长得像「异父异母亲兄弟姐妹」这件事,从来是网上玩梗打趣的热门话题…
比如,林东临和郭俊杰…
请机器来找「异父异母的亲兄弟」
首先要找一堆长相几乎一模一样的人作样本。面对全球 70 亿茫茫人海,怎么找是个问题。
科学家找到了加拿大艺术家弗朗索瓦布鲁内尔 (François Brunelle)。从 1999 年,这位艺术家就在全球收集相似人相。靠着「找对门路」,科学家获取了 32 对长相酷似的样本,并请参与者提供了详细的生物特征、所在地及生活方式问卷。
为保证脸部比对更客观,科学家找来三种算法 / 模型,共同「拆解」脸部细节,判断相似度。
其中包括了 ——
(1)自定义深度卷积神经网络 Custom-Net,一种来自 AI 公司 Herta,主用于监控领域的 CNN 模型;
(2)应用在 Matlab 上,常用于面部分类任务的 MatConvNet;
(3)来自微软 Azure 的 Microsoft Oxford Project 人脸 API,常用于面部分析;
这些模型内置数百万参数,且历经上千主题下的数百万张面部图像训(折)练(磨),能识别姿势、发型、表情、年龄、配饰等诸多特征,对相似图像,模型将给出从 0 到 1 的一个相似度区间。
如果机器们三方「会审」一致判断极为相似,那科学家就会将样本作为重点研究对象。最终在 32 对样本中,有 16 对被三方认可。
之后是 DNA 比对环节。科学家利用一种名为单核苷酸多态性 (SNP)的基因特征,比对各组长相高度相似人的唾液内 DNA 样本。
此后,再通过无监督聚类热图检测,让机器判断每对 DNA 是否属于一个类型(即相似)。
结论有点因吹斯汀
结果显示,在 16 对「被机器全部认可」样本 DNA 中,科学家发现,有 9 对被聚成一类,他们在 3700 个基因中,共享了超过 19200 个 SNP。同样,在 K-means 算法中,最终结论也类似。
此外,科学家还研究了相似配对的生物特征及生活方式。他们在体重、身高、是否吸烟、教育水平等方面也在配对组中相互有关联,这说明,共享的遗传变异不仅影响长相,也造成相似的行为和习惯。
研究者形容该结果十分「striking」。研究者还排除了近亲关系的可能,并发现,这些样本比长相不同的双胞胎,基因相似度更高。
更有意思的是,剩下 16 组未通过三方机器视觉特征认可的样本中,也只有一对样本 DNA 被聚类在一个集合。
在人种和地域方面,科学家还进行祖先溯源,他们观察到,几乎所有相似配对样本的祖上生活地区都很靠近。
但需要指出,本文主题在其他多组学研究中,却有着不同结论。
比如 DNA 甲基化模式下,16 对高度相似样本只有一堆匹配;
再比如从微生物角度看,16 对相似样本中,口腔菌群相似的仅一对,且这对样本通过 SNP 也没被聚类到一起。该领域有研究认为,口腔微生物相似度与皮下脂肪有关,可能导致相似长相(如:脸上肉多)特征的人,有相似的口腔微生物特征。
团队介绍
本文一作 Ricky S. Joshi,计算生物学家,来自西班牙巴萨罗那 Josep Carreras 白血病研究所 (IJC),研究方向主要为遗传学和表现遗传学,其个人页面显示,Ricky 致力于发现人类基因组中的病理性变异。
二作 Maria Rigau ,同样 Base 在西班牙,是巴塞罗那超级计算中心 (BSC) 的博士,专业为生命科学,主页头像显示,这是一位蛮喜欢狗狗的女研究者。
One More Thing
有网友指出,马斯克长相有点像爱迪生,还 Po 了下面这张图 ——
不知你怎么看?(手动狗头)
参考链接:
https://www.cell.com/cell-reports/fulltext/S2211-1247(22)01075-0
https://neurosciencenews.com/genetics-look-alikes-21283/
https://hertasecurity.com/
https://bigthink.com/health/look-alike-genetics-behavior/