数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型

2024/01/18

12月28日,山西省(民营企业)“数据要素×科技创新”大会暨山西数据流量谷启动仪式在太原举行。省委副书记、省长金湘军出席并启动。省委常委、统战部长徐广国讲话。副省长熊继军致辞。中国科学院院士、国际欧亚科学院院士陈润生围绕“人工智能大模型”作精彩演讲,给与会领导嘉宾带来一场引领时代浪潮的主题分享。

 

数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图1)


我这列举了最近大模型出现以后中国跟美国之间的比较。目前国内外大模型发展迅速,仅国产大模型就达到116家,主要集中体现在百度的“文心一言”、腾讯的“混元”、阿里的“通义千问”、华为的“盘古”等大模型。 


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图2)


以华为的“盘古”大模型3.0为例,他们用了 3DEST 的三维神经网络来处理气象数据,气象预测的速度提高了 10000 倍,是首个 AI 预测赢了传统数值预测的产品。基于“盘古”大模型 3.0 的 5+N+X 三层架,华为还能够量产各不相同的行业大模型。


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图3)


但我要说的是,大模型虽然提供了一个非常重要的学术概念和学术平台,但实际训练(training)中需要消耗大量资源的,至少要准备几十亿人民币,所以并不适合每家公司都做普适的大模型


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图4)


大语言模型的出现,对于整个科学和社会都产生了广泛和深刻的影响。在生物医学领域,微软做ChatGPT的同时,实际上它还做了Bio GPT,把大模型直接用到生物医学去。谷歌也造了一个用于生物医学的大模型Med PaLM,可以看到整个做大模型的行业对于生物医学的重视。

 

Med-PaLM 2就是由谷歌DeepMind的医疗健康团队在PaLM 2的基础上微调得到。Med-PaLM 2能够根据用户的输入来检索医学知识,并对其进行推理来回答医学问题,可以达到辅助医生完成日常报表,甚至辅助医生进行诊断的效果。比如,直接给Med-PaLM 2输入一幅X光片,它会自动根据输入信息来对患者的病情进行分析和诊断。Med-PaLM 2是目前第一个在美国医疗执照考试上达到“专家”水平的大语言模型。


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图5)


我们国内也开始启动了用于生物医学的大模型。比如百度特别成立了一个子公司叫百图生科,百图生科生命科学大模型“xTrimo”,是全球首个、也是目前最大的生命科学领域的“超大规模多模态模型体系”。除此之外,像腾讯、阿里、华为、清华、春雨医生、医联等,也都在生物医学领域探索尝试。 

 

《新英格兰医学杂志》是国际上最顶尖的医学学术刊物,它从2024年开始成立专刊,这个专刊的名字就是《人工智能》。它有一篇综述,可以看到人工智能未来几乎可以成为所有医学部门中的重要组成部分。


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图6)


来自全球知名咨询机构麦肯锡的预测数据显示,生成式AI将为全球带来至少9万亿美元的经济价值增量。在这9万亿美元的经济增量中,排在前三的产业分别是高科技、零售、金融,预计产生的经济增量分别为2000亿美元-4600亿美元之间。即便是在农业这样被视为最传统的产业中,也将带来至少400亿美元的经济增量。

 

三、关于AI大模型的思考

 

我下面主要跟大家讨论一些关于AI的想法。实际上,为什么这波大模型会引起全世界的广泛注意,主要是在大模型出现以后人们发现了一些新现象。这些新的现象我这列出来有三个典型的词,涌现、顿悟、幻觉,这是AI 从来没有出现过的现象。

 

第一个新的现象是涌现。一个复杂系统由很多微小个体构成,这些微小个体凑到一起,相互作用,当数量足够多时,在宏观层面上展现出微观个体无法解释的特殊现象,即为“涌现”。大模型的实验证明,当大模型规模超过一定范围以后,会出现一些新的结果,而这些结果是你教给他的知识里没有的。那么显而易见一个简单的演绎,就是人工智能有没有可能超过自然智能(人脑)?如果能够超过,那么将是一个什么样的这个态势和社会结构?这是当前最核心的焦点。当然我认为这个时间不会来得那么快,但是这个问题确实存在。

 

第二个新的现象是顿悟。“顿悟”则是大模型在数据训练量较少的情况下突然学会了其中的规律,这种现象是超出传统计算机能力的。这是人脑学习的一种模式,学到某一个时间开窍了,计算机不可能出现顿悟,但是大模型会出现顿悟的情况。


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图7)


第三个新的现象是幻觉。“幻觉”与“涌现”是相对应的。大模型给出的结果如果是训练中没有提供的,但是合乎逻辑且客观存在的,那就是“涌现”;“幻觉”则是错误或者“胡说八道”的东西。“幻觉”和“涌现”,都是大模型给出的新东西,但其性质不同。现在各领域都在研究人工智能大模型,这些大模型出现极端情况也是业界专业人士所担忧的。

 

在国际环境中,最具实力的大模型公司都在你追我赶,致力于开发最前沿的大模型。比如,Open AI 正在内部研究 GPT-5;而2023年12月, Google 公布了Gemini 1.0 大模型,几乎全面领先GPT-4。

 

另外,已经有人尝试用现在的大模型来驱动第三方系统。比如,用大模型驱动手术机器人,它就可以代替外科医生做手术。斯坦福大学的华裔科学家李飞飞目前已在技术上实现,0训练基础的机器人接入大模型后可完成复杂指令。也就是说,大模型接入机器人后,把复杂指令转化成具体行动规划,无需额外数据和训练,人类就可以很随意地用自然语言给机器人下达指令。


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图8)

大模型这样的发展速度,随之带来的是尖锐的社会问题。当前人们争论的焦点就是,大模型能不能超过强人工智能?超过之后,又将带来什么样的社会问题?

 

强人工智能即通用人工智能(Artificial General Intelligence),简写为AGI。强人工智能观点认为“有可能”制造出“真正”能推理和解决问题的智能机器,并且,这样的机器将被认为是具有知觉、有自我意识的。属于人类级别的人工智能。它能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。


为此很多人有深刻的担忧,这里我列举几个典型人物。

 

OpenAI CEO萨姆·奥特曼代表激进派,他曾预言,在10年内全球将可能拥有一个强大的 AI 系统。换言之,他主张大模型在十年内是可以突破人类智能的。另外一位是人工智能的最早奠基人杰弗里·辛顿,他说“人类只是智慧演化过程中的一个过渡阶段”,言外之意就是,他认为人工智能将来有可能超过人的智能。

 

正是因为世界广泛认识到大模型带来的深刻社会问题, 在2023年3月22号,生命未来研究所(Future of Life)向全社会发布了一封《暂停大型人工智能研究》的公开信,呼吁所有人工智能实验室立即暂停比GPT-4更强大的人工智能系统的训练,暂停时间至少为6个月。截止目前,图灵奖得主Yoshua Bengio、马斯克、苹果联合创始人Steve Wozniak、Stability AI 创始人Emad Mostaque等上千名科技大佬和AI专家已经签署公开信。

 

据高盛统计,截止目前,在美国大约7%的工作岗位可以被AI取代,63%的工作岗位会得到AI的辅助,仅有30%的工作岗位没有受到AI的影响。可能有3亿的工作岗位将会被AGI取代。


在2023年5月13日,美国白宫专门成立了生成式人工智能工作组来研究生成式大模型会导致什么结果。在12月,欧盟《人工智能法案》达成协议,通过了全球首部人工智能领域的全面监管法规,标志着人工智能立法进程迈出了重要一步。

 

我们可以看到,国际上发达经济体对大模型关注的上涨,也就深刻认识到了大模型人工智能带来的广泛社会影响力。未来我们可以从原创性大模型开发的角度进行探索,也可以从算力(比如山西地区就具备很好的算力基础)、数据(建立纵向模型)两大要素出发,不断提升国际竞争力。


数字前沿|中国科学院院士、国际欧亚科学院院士陈润生:人工智能大模型(图9)

 

最后,我借用这样一张神经生理学图片总结自己的观点。图中展示的是新生儿、两岁儿童的脑结构。大家可以看到这是一个知识快速增长的过程,而知识的增长直接影响了神经网络的空间结构复杂程度。所以我认为当前大模型的发展趋势只是增加计算原件的数量,增加学习知识的数量似乎还并不充分,应当更好地考虑生物体脑结构的神经复杂性,也许能够对有效提高大模型的工作能力有更大的帮助。所以我并不认为大模型将很快代替人类智能,但这个科学命题也越来越值得考虑,越来越值得研究了。