• 首页
  • 行业
  • 财经
  • 综合
  • 热点
  • 科技
  • 商业
  • 要闻
  • 观点
  • 经济
  • 社会
  • 法治
  • 文旅
  • 体育
  • 健康
  • 生活
  • 国际
  • 国内
  • 教育
logo
  • 财经 >
  • 正文

全球热讯:专访复旦大学MOSS系统负责人邱锡鹏:ChatGPT的革命性体现在大模型的“涌现能力”

2023-04-13 20:07:30 来源:21世纪经济报道

ChatGPT展现出来的令人惊艳的对话理解与表达能力,让越来越多人意识到,人工智能已经迎来了全新的里程碑。并且有望作为一个至关重要的基座系统,以前所未有的速度渗透进各行各业,持续引爆未来世界的数字经济体系。

近日,复旦大学计算机科学技术学院教授、MOSS系统负责人邱锡鹏在接受21世纪经济报道记者专访时表示,ChatGPT的革命性体现在大模型的“涌现能力”上。在大模型训练过程中,出现了一些意外的、超乎预期的能力表现。据悉,在训练计算量大概在10的22次方之后,模型能力会完成从量变到质变的飞跃,呈现出惊人的爆发式增长。

“比如说你读两本书可能就背下来,但是当你读1万本的时候,你可能就理解了一些道理,当你读1亿本的时候,很可能融会贯通,从中掌握世界的规律。”邱锡鹏表示。但大模型具体是怎样在突破某个值后突然变得智能,仍然是个未解之谜。


(相关资料图)

不过,“涌现”的出现似乎也证明了一条路是正确的,即扩大模型规模,即可使其具有“智能”。在AI围棋打败人类棋手之时,Google Bert的参数规模为3亿;2020年后GPT-3横空出世,参数量级已经跨越到了1750亿。

涌现能力的背后,则进一步隐含着三个非常重要的技术:情景学习、思维链和指令学习,这也是ChatGPT得以在人工智能领域叱咤风云的关键原因。

情景学习深刻改变了传统机器学习的范式,只需要通过一系列精心设计的提示语句(Prompt),对任务进行详细描述,然后再辅以一些情景例子,就能够让模型参考着既定例子完成特定任务。

思维链则使得模型具有了推理的能力,让本来模型不会解的一个个复杂问题,分解成很多简单问题,然后通过逐一解决简单问题,最终使得复杂问题同样迎刃而解。

指令学习则使模型能够理解并执行各种自然语言指令,将任务指令化以便机器理解。人类只需要在少量的任务上进行指令化,在经历大概40多个任务指令化之后,对模型进行适度微调,就很容易泛化到上百、上千种任务,即使它从来没有见过。

在模型优化过程中,人的参与意义非常重要,使得机器在迭代中始终保持和人类的价值观、思维方式对齐,也避免了机器自己迭代起来有可能会离人类的偏好和初衷越来越远。

放眼国内,大模型的竞争也愈发激烈。2月20日,复旦大学自然语言处理实验室发布了国内首个类chatgpt模型MOSS,3月16日,百度发布“文心一言”,打响大厂入局的第一枪,此后,阿里云、商汤科技均公布了自家的大模型产品,国内大模型的百团大战一触即发。

但这些产品较ChatGPT来说,还存在一定差距,邱锡鹏也承认,目前MOSS的任务完成度却并不高,主要原因在于MOSS在部署和训练上投入的资本还非常有限,相较于千亿级的ChatGPT,大概只是其规模的十分之一。“我们现在仍旧在加紧迭代MOSS,预计将于4月中旬开源。”

邱锡鹏表示,尽管目前的通用人工智能技术尚且存在很多不足,包括随机性、不可控、容易“一本正经地胡说八道”等等,但随着时间的推移,这些问题都将在未来通过各种方式逐步改进。

正如图灵奖得主、著名人工智能专家杨立昆(Yann LeCun)所言:下一代模型应该更加具有事实性、无害性、即时性,并且能够灵活使用计算器、数据库、搜索引擎、模拟器等各种辅助工具,而这也是人们亟需重点解决的时代课题。

《21世纪》:我们如何复现ChatGPT这一大型语言模型?面临哪些挑战?

邱锡鹏:第一步需要先实现语言模型基座,第二步是指令微调,第三步是能力不断强化迭代。虽然这些关键步骤以及大概方法已经十分明朗,但每一步的细节都需要我们自己去一一摸索,还是充满着各种未知的挑战性。

第一步主要是Transformer架构上进行模块优化。首先,对于ChatGPT来说,它并没有特别关注中文,很多时候只是直接把中文按照英文的方式进行编码,我们作为中国人自然是希望对中文进行优化,就需要重新实现更好的中文编码,并想办法把中文和英文打通;此外,将来如果接入多模态的话,编码问题同样会带来架构设计以及训练稳定性等诸多问题与麻烦。

第二步是指令微调,个人认为指令微调的难度甚至比预训练更高。在预训练阶段,大家可以利用一些大公司成熟的预训练模型,在短时间内取得不错的训练效果;但是指令微调则非常难以立马做到,这一点上和OpenAI之间存在着非常明显的差距。

在与人类对齐方面,想要让模型的回答尽可能符合我们人类的思维习惯,也很难做到。而且考虑到OpenAI暂不开源,我们只能够一步步慢慢向前探索。如果我们要想超过ChatGPT,肯定就得去找到一条比它更好的实现路径,而这个过程无疑充满艰险。

《21世纪》:如何看待国内AI生态?

邱锡鹏:我们的生态还没有建好。OpenAI做ChatGPT的时候,它不需要分心做其他东西,只是把模型做好。微软帮它做算力,还有其它公司帮它做部署,数据也有专门的公司来进行数据清洗。它是在整个生态中去做的,这样的多方协作生态促使它的发展非常快。

而我们国内每家公司都要做,这就会产生一个问题,每家都做自己的,但每家数据、算力也有限,也没有多少钱可以支持研发,并且又在做一些很基础的、重复性的事情。而我们希望能促进大模型的协作生态,在MOSS开源之后,底层的重复性的工作就不要做了,把整个生态建起来。

如果我们有一个统一的大模型平台和基座,下面对接一下国产的算力,做好一份接口,大家都可以来用,能够去促进一个生态链的建设,使得整个中国的AI能够往前进一步发展。我们现在仍旧在加紧迭代MOSS,预计将于4月中旬开源。

《21世纪》:3月22日,美国的生命未来研究所向全社会发了一封公开信,呼吁所有的人工智能实验室暂停研制比GPT-4更强大的AI系统的训练,暂停的时间是6个月,如何看待这件事?

邱锡鹏:机器的迭代速度会快于人,在某一天总会超过人的,停止这六个月或者半年没有意义。并且很多时候也很难停下来,从很多公司的商业利益出发肯定会迭代的。我们目前为止的AI还是可控的,它目前的形式还是在语言层面的,没有接入到社会的方方面面。有一天当它接管了很多东西,成为了我们的某种基础设施之后,这就非常关键了,你要控制它各种能力,这时避免危害不光要靠技术,还要靠一些法律法规。

《21世纪》:类ChatGPT的AI将如何对未来社会形成颠覆性影响?

邱锡鹏:考虑到ChatGPT已拥有通用语言理解的能力,并可以进一步增加对外接口,成为通用人工智能的技术基座。这也就意味着通用人工智能的加速实现对于现阶段的人类来说已经不是梦想。甚至乐观一点说,像科幻片里面的人工智能形象可能很快就会在我们的生活中出现。

以ChatGPT为代表的通用人工智能技术,可以引爆数字经济,充分发挥数据和算力效能,并催生出海量的新商业模式;可以赋能产业数字化,并通过人机协同的方式解决行业专家资源不足的问题;可以以数字人、个人助理、搜索引擎等形式对数字经济新业态、新模式提供发展动能;更将深刻改变教育、社会治理、司法等领域的生态,大幅提升行业水平。

当然,我们也必须正视,目前的通用人工智能技术尚且存在很多不足,包括随机性、不可控、容易“一本正经地胡说八道”等等,不过,相信这些问题随着时间的推移,都将在未来通过各种方式逐步得到改进。

对于下一阶段的大型语言模型来讲,我们目前重点需要去做的事情就是让模型和现实世界以及人类的价值观进行“对齐”,成为一个真正的智能体,具有自身学习、跨模态学习、知识和工具利用等能力。与此同时,AI与人类价值观“对齐”也同样不可忽视,毕竟如果AI的价值观和人的价值观背道而驰,那将会是非常危险的。

《21世纪》:AI未来的发展方向是如何的?

邱锡鹏:以前一直做的人工智能模型都是弱人工智能模型,比如AlphaGo只能下围棋。目前ChatGPT的表现类似于通才,但是它可能在细分的专业性上和行业中比较顶级的专家还有很大的差距。我认为它将来会有不同的分支,往不同的专业方向上发展,以大模型为基础,产生很多的分领域的不同模型。这对于之前的人工智能研究来说应该都是一个大的颠覆。

《21世纪》:中国如何在这场科技浪潮中抓住机会?

邱锡鹏:我是比较乐观的。我们的AI以场景的丰富度或者应用层面的创新性领先,在AIGC或者大模型浪潮中,应用驱动也是很重要的。有了底座之后,我们再去把AI产品打磨好,这些应用场景的数据在我们国内是非常丰富的。

(文章来源:21世纪经济报道)

责任编辑:{ij7}

    为您推荐

  • 全球热讯:专访复旦大学MOSS系统负责人邱锡鹏:ChatGPT的革命性体现在大模型的“涌现能力”

    【专访复旦大学MOSS系统负责人邱锡鹏:ChatGPT的革命性体现在大模型的“涌现能力”】近日,复旦大学计算机科学技术学院教授、MOSS系统负责人邱
  • 世界热门:商络电子股东户数增加4.47%,户均持股12.67万元

    商络电子最新股东户数1 87万户,低于行业平均水平。公司户均持有流通股份1 72万股;户均流通市值12 67万元。
  • 速看:北方华创:预计2023年一季度盈利5.60亿至6.20亿 净利润同比增长171.24%至200.30%

    4月14日,A股上市公司北方华创(002371)发布一季度业绩预告,公司预计2023年1-3月业绩大幅上升,归属于上市公司股东的净利润为5 60亿-6 20亿
  • 最新消息:【西安翻译学院校友访谈】直上青天揽明月 欲倾东海洗乾坤——访宁波环宇港通国际货运代理有限公司总经理王世清

    西安翻译学院2000级校友王世清,于9年前创办了宁波环宇港通国际货运代理有限公司,现担任总经理一职。回首20年前毕业那一刻,他依然对自己当初
  • 福建省教育考试院关于做好2023年普通高考补报名工作的通知

    各市、县(区)教育招生考试机构:根据《教育部关于做好2023年普通高校招生工作的通知》(教学〔2023〕1号)、《福建省高等学校招生委员会福建
  • 天天热消息:通用技术集团丁子哲:把数智基因融合进机床主业发展

    4月12日下午,由新京报、千龙网主办,新京智库、贝壳财经承办的“2023新京智库春季峰会——数实融合共促经济高质量发展”论坛上,通用技术集团
  • 北京农商银行与首开集团签署战略合作协议

    北京农商银行官微消息,4月12日,北京农商银行与首开集团签署《银企战略合作协议》。根据本次战略合作协议,双方将围绕首开集团新的战略规划和
  • 天天新动态:新型储能步入风口期 温控技术成破局关键

    在“双碳”目标推动下,能源行业正面临新的变革,作为行业重要一环的储能温控,也迎来了高速发展期。“截至现在,每年风、光电新增量分别超过1
  • 保利建工海玥天汇——价格, 户型丨楼盘测评

    乐居楼盘测评系列测评师:乐居买房买房无小事,细节是大事。帮助购房者在买房前,全面透彻的了解一个项目的优劣就是我们的工作。由专业的测评
  • 环球讯息:知行向初心 廿载逐梦行——西安城市交通技师学院举行优秀校友捐赠仪式

    树高千尺有根,水流万里有源。4月11日下午,西安城市交通技师学院2020届校友张恒捐赠仪式在学院多功能报告厅举行。王振峰院长、学校领导、全体
  • 教育部公示西安翻译学院获批三门国家级一流课程

    日前,教育部高等教育司对第二批国家级一流本科课程认定结果进行了公示。西安翻译学院共有3门课程榜上有名。获批数量在全省民办高校中排名第一
  • 报道:权威部门话开局 | 市场监管总局:进一步促进公平竞争 破除地方保护和行政垄断

    4月13日,国新办举行第十四场“权威部门话开局”系列主题新闻发布会,市场监管总局副局长甘霖表示,近年来,市场监管总局依照《反垄断法》查办
  • 国家产融合作平台助企融资突破5000亿元

    4月13日,四川绵阳举行的首届全国产融合作大会上了解到,国家产融合作平台上线两年来助企融资已突破5000亿元。据了解,工信部会同财政、金融监
  • 【全球时快讯】快讯!中国电子30亿成立数据产业公司

    天眼查App显示,4月12日,中电数据产业有限公司成立,法定代表人为陆志鹏,注册资本30亿,经营范围包括数据处理和存储支持服务、大数据服务、
  • 每日简讯:电影《不二兄弟》为孤独症家庭特轮放映

    4月12日晚,一场专门面向孤独症家庭举办的电影《不二兄弟》特轮放映活动在京举行。中国残联宣传文化部主任、中国残疾人事业新闻宣传促进会副会
  • 光大期货:盘后点评4.13

    光大期货:盘后点评4 13
  • 世界今亮点!“星星的孩子”越跑越远,张家界武陵源生态马拉松迎来特殊跑团

    文 视频华声在线全媒体记者叶竹张家界武陵源生态马拉松开跑在即,迎来一个特殊跑团——全国第一支全程马拉松心智障碍者跑团、广州市智力残疾人
  • 消金公司2022年“成绩单”:前三利润总和占比超七成 行业马太效应明显

    随着近日多家上市公司相继披露2022年业绩报告,其旗下的消费金融(下称“消金”)公司的业绩也随之浮出水面。据记者不完全统计,截至目前,30家
  • 【独家焦点】北京全市空气质量已达严重污染

    据北京市生态环境监测中心官网消息,截至4月13日16时,北京实时空气质量指数为483,污染级别为6级,已达严重污染标准。目前空气中的首要污染物
  • 环球滚动:“数造新实体”案例调研 云网融合,江苏的智慧全媒体之路 ——江苏省广播电视总台荔枝云项目

    中国互联网络信息中心数据显示,截至2022年6月,网络视频用户规模已达9 95亿。这意味着,我国每10个人里,就有7个网络视频用户。随着受众对优
  • 世界速递!锦浪科技现2笔大宗交易 总成交金额8143.80万元

    锦浪科技4月13日大宗交易平台共发生2笔成交,合计成交量70 00万股,成交金额8143 80万元。成交价格均为116 34元,相对今日收盘价折价7 00%。进
  • 凯盛科技(600552):显示板块拖累业绩 新材料业务持续高增

    凯盛科技(600552):显示板块拖累业绩新材料业务持续高增
  • 世界头条:铁军风采 | 河南省:实干笃行 履践致远

    转自:生态环境部2月23日,河南省首个生态环境污染源自动监控实训基地在郑州新密市落成投用,该基地将为执法人员学习污染源监控技能提供实训场
  • 视点!重磅!2023年中国及重点省市抗体偶联药物(ADC)行业政策汇总及解读(全) 云南、江西、河南已写入“十四五”规划

    转自:前瞻产业研究院行业主要上市公司:荣昌生物(688331),恒瑞医药(600276)、科伦药业(002422)等本文核心数据:抗体偶联药物(ADC)行业政策
  • 环球热消息:河南沙尘继续!预计18日结束

    4月13日,据河南气象消息,今日河南部分地区雨水渐起,对沙尘起到了一定沉降作用。但不远处,沙尘天气又将卷“土”重来,预计今晚至15日白天,
  • 西海位于哪个省?西海藏语名叫什么?

    西海是哪里是哪个省,西海是青海湖的别称,位于青海省。青海湖,藏语名为措温布,意为青色的海。其位于青藏高原东北部、青海省境内,中国最大
  • 全球热推荐:古法琉璃是怎么制成的?常见种类有哪些?

    古法琉璃是什么材质,古法琉璃是琉璃材质,为琉璃的种类之一,采用“琉璃石”加入“琉璃母”在1400多度的高温下烧制而成,常见种类有手工琉璃
  • 车主信息如何查询?方法有哪些?

    如何查询车主信息,使用身份证到就近的保险公司查询,或者通过网络上的查询软件进行查询。携带自己的身份证到当地的车管所查询车主信息,不过
  • 环球动态:人民的名义好不好看?电视剧中祁同伟最后怎么了?

    人民的名义祁同伟结局,电视剧《人民的名义》中,祁同伟结局开枪自杀了,祁同伟收受贿赂,婚内出轨等见不得人的勾当已经被警方发现,祁同伟被
  • 全球观热点:国家文物保护单位有哪些级别?判定方法是什么?

    国家文物保护单位分级吗,中国文物保护单位级别分为文物保护点、区级文物保护单位、县级文物保护单位、市级文物保护单位、省级文物保护单位以

相关推荐

  • 全球热讯:专访复旦大学MOSS系统负责
  • 世界热门:商络电子股东户数增加4.47
  • 速看:北方华创:预计2023年一季度
  • 最新消息:【西安翻译学院校友访谈
  • 福建省教育考试院关于做好2023年普
  • 天天热消息:通用技术集团丁子哲:
  • 北京农商银行与首开集团签署战略合
  • 天天新动态:新型储能步入风口期
  • 保利建工海玥天汇——价格, 户型
  • 环球讯息:知行向初心 廿载逐梦行

阅读排行

  • 成人教育是什么形式?成人教育的办学格局是什么?
  • 环球资讯:icq是什么软件?icq注册方法有哪些?
  • 快资讯:柏肤源是国产品牌吗?柏肤源护肤品成分有哪些?
  • 焦点热讯:华夏在线业务范围包含哪些?注册资金是多少?
  • 牛皮鞋真假如何辨别?有哪些方法?
  • 【天天新视野】地沟油有什么危害?地沟油制作过程是什么样的?
  • 特朗普:即使被判有罪 也不会放弃竞选美国总统
  • 【世界时快讯】拜登闪电访问北爱尔兰 能否打破地区政治僵局?
  • 环球微速讯:熊犬是什么动物?熊犬起源于哪里?
  • 世界今日报丨新华通讯社与复旦大学签署全面合作协议

291 32 36@qq.com

Copyright © 1998-2015 by 中国北京网版权 所有 京ICP备12018864号-3

营业执照公示信息