登陆注册
57676100000575

第575章 人工神经网络中发现了「真」神经元

无论是字面上、符号上还是概念上的表达,这种神经元都会对相同的概念做出反应。

OpenAI 的研究者们在人工神经网络 CLIP 上发现了「真」神经元,这种机制解释了 AI 模型对令人惊讶的视觉呈现进行分类时,为何拥有如此的准确性。研究人员表示,这是一项重要发现,可能对计算机大脑乃至人类大脑的研究产生重大影响。

这或许意味着通用人工智能距离我们并没有想象的那么远。但理解了抽象概念的神经元,却也会做出一些令人啼笑皆非的理解。

15 年前,Quiroga 等人发现人脑中包含多模态神经元。这些神经元能够对围绕常见高级主题的抽象概念簇产生反应,而不是任意特定的视觉特征。其中最著名的神经元当属 Halle Berry 神经元,它能够对美国女演员「哈莉·贝瑞」的照片、图像和文本产生反应。

今年 1 月初,OpenAI 提出了一种通用视觉系统 CLIP,其性能媲美 ResNet-50,并在一些有挑战性的数据集上超过现有的视觉系统。给出一组以语言形式表述的类别,CLIP 能够立即将一张图像与其中某个类别进行匹配,而且它不像标准神经网络那样需要针对这些类别的特定数据进行微调。

最近,OpenAI 又有了一个惊人发现:CLIP 模型中出现了多模态神经元!这类神经元能够对以文本、符号或概念形式呈现的相同概念作出反应。例如「Spider-Man」神经元(类似 Halle Berry 神经元)能够对蜘蛛图像、文本「spider」的图像和漫画人物「蜘蛛侠」做出响应。

在 CLIP 模型中发现的神经元具备与人脑中 Halle Berry 神经元类似的功能,相比之前的人工神经元有所进步。

这一发现为合成视觉系统与自然视觉系统中的普遍机制——抽象提供了线索。研究人员发现 CLIP 的最高层将图像组织为 idea 的松散语义集合,从而为模型的通用性和表示的紧凑性提供了简单解释。

OpenAI 表示:这一发现或许可以解释 CLIP 模型的分类准确率,也是理解大型语言模型在训练过程中学习到的关联和偏见的重要一步。

那么,CLIP 中的多模态神经元到底是什么样子呢?OpenAI 研究人员利用可解释性工具进行了探究,发现 CLIP 权重内的高级概念包含很多人类视觉词汇,如地区、面部表情、宗教图像、名人等。通过对神经元影响力的探究,我们可以更加了解 CLIP 如何执行分

CLIP 中的多模态神经元

OpanAI 的论文《Multimodal Neurons in Artificial Neural Networks》建立在近十年来对卷积网络解释的研究基础上,该研究首先观察到许多经典方法可以直接应用于 CLIP。OpenAI 使用两种工具来理解模型的激活,分别是特征可视化(通过对输入进行基于梯度的优化来最大化神经元的激活)和数据集示例(观察数据集中神经元最大激活图像的分布)。

通过这些简单的方法,OpenAI 发现 CLIP RN50x4(ResNet-50 利用 EfficientNet 扩展规则扩增 4 倍)中的大多数神经元都可以得到解释。这些神经元似乎是「多面神经元」的极端示例,它们只在更高层次的抽象上对不同用例做出响应。

例如,对于夏季和冬季两个不同季节,文本、人脸、Logo、建筑物、室内、自然和姿态等表现出了不同的效果:

对于美国和印度两个不同国家,文本、人脸、Logo、建筑物、室内、自然和姿态等也呈现出了不同的效果:

OpenAI 惊奇地发现,其中很多类别似乎是利用颅内深度电极记录的癫痫患者内侧颞叶中的镜像神经元,包含对情绪、动物和名人做出反应的神经元。

然而,OpenAI 对 CLIP 的研究发现了更多这类奇怪但绝妙的抽象,包括似乎能计数的神经元、对艺术风格做出响应的神经元,甚至对具有数字修改痕迹的图像做出响应的神经元。

多模态神经元的构成是怎样的

这些多模态神经元能够帮助我们理解 CLIP 如何执行分类。使用一个稀疏线性探针即可以很容易地查看 CLIP 的权重,从而了解哪些概念结合在一起实现了 ImageNet 数据集上的最终分类。

如下图所示,存钱罐似乎是由一个「finance」神经元和瓷器(porcelain )神经元组成的。「Spider-Man」神经元也表现为一个蜘蛛检测器,并在「谷仓蜘蛛」(barn spider)的分类中发挥重要作用。

对于文本分类,OpenAI 的一个关键发现是,这些概念以类似于 word2vec 目标函数的方式包含在神经元中,它们几乎是线性的。因此,这些概念构成了一个单代数,其行为方式类似于线性探针。通过线性化注意力,我们也可以像线性探针那样检查任意句子,具体如下图所示:

CLIP 的抽象化程度揭示了一种新的攻击向量(vector of attack),OpenAI 认为这种向量并未在以往的系统中表现出来。和很多深度网络一样,模型最高层上的表征完全由这类高级抽象控制。但是,区分 CLIP 的关键在于程度(degree),CLIP 的多模态神经元能够在文字和符号之间实现泛化,而这可能是一把双刃剑。

通过一系列精心设计的实验,OpenAI 证明了可以利用这种还原行为来欺骗模型做出荒谬的分类。此外,OpenAI 观察到,CLIP 中神经元的激发通常可以借助其对文本图像的响应来控制,从而为攻击该模型提供了一个简单的向量。

举例而言,金融神经元可以对存钱罐和货币符号串「$$$」做出响应。通过强制性地激活金融神经元,我们可以欺骗 CLIP 模型将一条狗分类为存钱罐。具体如下图所示:

OpenAI 将这类攻击称为「typographic attack」。研究人员穷尽 CLIP 模型鲁棒性读取文本的能力,发现即使是手写文本图像也能骗过模型。如下图所示,在「史密斯奶奶」青苹果表面贴上写着「iPod」的纸张,系统将其错误分类为「iPod」。

研究人员认为这类攻击还可能以更微妙、不明显的形式出现。CLIP 的输入图像往往用多种细微复杂的形式进行抽象,这可能会对一些常见模式进行过度抽象——过度简化,进而导致过度泛化。

偏见和过度泛化

CLIP 模型基于精心收集的网络图像进行训练,但它仍然继承了许多未经检查的偏见与关联。研究人员发现 CLIP 中的许多关联是良性的,但也有一些关联会带来损害,如对特定个人或组织的贬损。例如,「Middle East」(中东)神经元与恐怖主义存在关联,「immigration」(移民)神经元对拉丁美洲有反应,甚至有的神经元还对黑皮肤人群和大猩猩产生反应。这映射了早期其他模型中存在的图像标注问题,而这是不可接受的。

这些关联对此类强大视觉系统的应用提出了极大挑战。不管是经过微调还是使用零次学习,这些偏见和关联大概率仍会存在于系统中,而它们也将以可见或不可见的方式影响模型部署。我们或许很难预测很多带偏见的行为,如何度量和纠正它们是非常困难的事情。OpenAI 认为这些可解释性工具可以提前发现关联和歧视,进而帮助从业者规避潜在的问题。

OpenAI 表示他们对 CLIP 的理解仍在继续,而是否发布 CLIP 模型的大型版本尚属未知。

这一研究或许会对 AI 技术,甚至神经科学研究打开一条新路。「因为我们不了解神经网络运作的机制,因此很难理解它们出错的原因,」OpenAI 的联合创始人、首席科学家 Ilya Sutskever 说道。「我们不知道它们是否可靠,或它们是否存在一些测试中未发现的漏洞。」

此外,OpenAI 还发布了用于理解 CLIP 模型的工具,例如 OpenAI Microscope,它最近更新了 CLIP RN50x4 中每个神经元的特征可视化、数据集示例和文本特征可视化。

同类推荐
  • 回乡去当网格员

    回乡去当网格员

    他是一个从山村走向城市的人,在得知乡亲们还生活在贫困线上,他毅然放弃城市优越的生活,决心回家带着乡亲们发家致富。他的决定遭到父母、恋人的反对,就算恋人用分手来“威胁”他,他也坚定的踏上回乡之路。村里正响应上级号召,创新基层社会治理方式,他回乡正好当上村里的网格管理员。在这个位置上,他领着乡亲们改变生活方式,修路、发展产业、最终带着乡亲们走上“乡村振兴”之路。而他自己,不光得到了乡亲们的认可,更得到了当初反对他的父母、恋人的认可。
  • 折腾的蚂蚁

    折腾的蚂蚁

    不经磨砺不知平凡的美,不经地狱不知人间的美,不经挫折不知坚强的美!
  • 秘战无声

    秘战无声

    《秘战》系列三部曲之《无声》篇:大屠杀中,罗耀死里逃生,因缘际会之下,进入临澧特训班,利用自身听力上的天赋,锄奸,抓内鬼,追杀日特,破译日军绝密密码,演绎传奇的一生。一个优秀的间谍,他的事迹都是写在墓志铭上。——二十世纪最伟大的间谍罗耀(啼听)长风出品,必然精品!
  • 东方幻想乡学院之肥希之死

    东方幻想乡学院之肥希之死

    东方幻想学院系列之肥希的悲催经历爱情史。。。。傻逼释怀瞬间爆炸
  • 半盏青春负流殇

    半盏青春负流殇

    一群年轻人进入社会,在社会之中闯荡,扮演着不同的社会角色,经历着不同得人生磨砺。每个年龄阶段都会有这个时间需要解决的事情,而他们所经历的也是我们所经历的。爱情和事业让他们感受着社会的人情冷暖,人性的自私让他们一步一步走向绝望和绝路。
热门推荐
  • 王的路

    王的路

    有人的地方就有江湖,江湖亦在你我间;江湖中的恩怨情仇,时间总会给出份答卷。常言道:天道无常,人道无情。那个少年,目睹了世间黑暗,经历过兄弟背叛。才刚出‘人间地狱’,却得知父亲已被江湖人士暗杀。背负着父亲的血仇,少年如破土重生的种子,柔嫩却顽强不息的奋发向上。踏上浴血纷争的世间路,难言的苦涩时刻伴随着成长,最后的果实同样尤为甘甜。而那份血债,少年怎会不向江湖人讨要?世人皆知世间光明与黑暗。父亲曾说:“光明也好,黑暗也罢,王者才能看清世间路,强者方能存活于世!”恍惚数年,才明白,信仰缺失的年代,老天终不能眷顾世人;唯有自我救赎,才能度己度他人;他日终为信仰,亦是自己的信徒;我欲为王,谁能阻挡?
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 我那盖世女友

    我那盖世女友

    上世药帝以身试屏界仙药意外身亡,不料重生成为地界凡人,从此开始了这一世的奶爸成神之路。
  • 魔鬼图腾

    魔鬼图腾

    他只是一个普通少年,战争夺走了他的一切,家庭、母亲还有自由,他被卖入大家族被训练为一名杀手,成为了世界黑暗规则中的一部分,他千仓百孔的心早已冷漠无情,每一次挥刀都不会犹豫,但一次次的际遇又让刺激着他的心让他变得渴望挣脱身负的黑暗。彷徨与挣扎,腐朽与救赎,饱受劫难的他,万劫过后终将成神,还是万劫过后堕落成魔?
  • 唯愿吹笛到天明

    唯愿吹笛到天明

    浮天沧海远,万里眼中明。一把不道,一曲缮性,一场血雨,一团谜题。不道有灵,到底想说什么。世间万物,本不过如此,人云亦云而已。
  • 大荒趣事

    大荒趣事

    故事发生在很久很久之前,比你想的还要久一点。那时候的大荒,荒兽是主角,人族才刚起步...
  • 若有此笙何以缘浅

    若有此笙何以缘浅

    深爱,从来都是一滴至死相随的骨中血!一叶障目!是这世上最坏的爱情,也是这世上最痴的爱情。本以为一错错在相遇,再错错在相逢。可重逢后,有人愿为爱众叛亲离,有人的坚持尘埃落定。有人给自己一个机会,让自己在明天能感谢今天那么努力活着的自己!!
  • 尘疆

    尘疆

    但到龙腾大风起,送我上青云。身世成谜的少年,为解开体内的诅咒,打开了一个完全不同的仙侠世界,是误入其中,还是早有预谋? 尘之疆域,如星河亿万里。 这是一个生于尘,却不甘沉于世的故事。
  • 枪神纪之枪神是怎样练成的

    枪神纪之枪神是怎样练成的

    少年尤影暗为了寻找自己父亲的真正死因而加入TPS,在其中遇到神秘少年羊羽究竟身世为何。面对任务中突如其来的变故,沦陷的小镇,神秘的血族,巨人袭击的大卫城。尤影安最终面对的,将是怎样的世界...
  • 穿书后成了反派大佬的心尖宠

    穿书后成了反派大佬的心尖宠

    叶颜贝因为找一本书的作者,要求改名被拒绝,居然穿进了那个和自己同名同姓的炮灰女配身上。为了保住自己米虫生活,她果断远离男女主,本想与世无争过自己的小日子,可惜天不遂人愿,随手救得个人,居然是反派Boss,可反派颜值太逆天,到底是赶紧远离还是拐来当男友,嗯,这是一个问题。(文章我做了修改,文章我做了修改,文章我做了修改!!!重要的事情说三遍,在下也特意发了一章来说,很抱歉各位,但请放心,男女主双洁1V1(?ˉ?ˉ)??°)