• 首页
  • 行业
  • 财经
  • 综合
  • 热点
  • 科技
  • 商业
  • 要闻
  • 观点
  • 经济
  • 社会
  • 法治
  • 文旅
  • 体育
  • 健康
  • 生活
  • 国际
  • 国内
  • 教育
logo
  • 汽车 >
  • 正文

微软推出 ZeRO++技术,可显著减少AI大模型训练时间和成本 环球时讯

2023-06-27 13:01:21 来源:IT之家


(相关资料图)

IT之家 6 月 27 日消息,微软研究人员日前推出了名为 ZeRO++ 的新技术,用于优化在训练大型 AI 模型时,容易遇到的数据传输成本和带宽限制的难题,可显著减少大模型训练时间和成本。

据悉,ZeRO++ 建立在现有的 ZeRO 传输技术基础上,并提供增强的通信策略,可提高训练效率,同时减少训练时间和成本。

▲ 图源 微软

为了减少参数通信量,ZeRO++ 可对权重进行量化,其利用基于块的量化方法来保持训练精度,这种优化的量化过程相对原始 Zero 传输技术更快更准确。为了能够尽量减少通信开销,ZeRO++ 通过在每台机器上保持完整的模型副本,以向 GPU 显存换取通信带宽。而在梯度通信方面,ZeRO++ 引入了一种名为 qgZ 的新的量化梯度通信方式,可以减少跨节点的流量和延迟。

▲ 图源 微软

这些改进的通信技术大大减少了通信量,微软研究人员表示,与 ZeRO 相比,ZeRO++ 减少了高达 4 倍的通信量,提高了训练吞吐量和效率。当在每个 GPU 上使用小批量大小时,在高带宽集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低带宽集群中,与 ZeRO-3 相比,ZeRO++ 实现了平均 2 倍的加速,使得大模型训练在更多种类的集群上更为可行。

IT之家注:IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 这样的大型模型,其训练需要跨多个 GPU 设备占用大量显存和计算资源,而 ZeRO++ 引入了通信优化策略,以克服在低带宽集群上进行训练时原有 ZeRO 传输技术的带宽限制。目前微软已经放出了相关技术文档,研究人员可以利用 ZeRO++ 更有效地训练模型,在 AI 领域探索新的可能性。

责任编辑:{ij7}

    为您推荐

  • 微软推出 ZeRO++技术,可显著减少AI大模型训练时间和成本 环球时讯

    IT之家6月27日消息,微软研究人员日前推出了名为ZeRO++的新技术,用于
  • 每日讯息!香港证监会行政总裁梁凤仪:研究在互联互通机制内引入大宗交易方式

    6月27日,香港证监会行政总裁梁凤仪出席由亚洲证券业与金融市场协会举
  • 中国(广东)-新加坡经贸合作交流会在新加坡举行

    中国(广东)-新加坡经贸合作交流会26日在新加坡举行,共达成合作项目3
  • 重庆市气象台发布今年首个高温预警信号 世界速看料

    重庆市气象台6月27日11时30分发布“高温橙色预警信号”,也这是今年重
  • 全球资讯:“请别叫马主任,叫我店小二就行” | 高质量发展调研行・海南站

    切割、焊接、打磨、喷漆……走进位于临高金牌港开发区的龙庆东南(海南
  • 【觉醒榜(井版强度榜)第102期】小加加、Z46、利托里奥喜提专武!黑阿尔及利亚上榜!_全球今热点

    大家吼啊!井鸽鸽携手云编委,马不停蹄带来本期觉醒榜(井版强度榜)内
  • 环球简讯:教成年人画画赚钱吗?35岁央美毕业生创业十年,靠开画室月入十万|启点

    马英强曾在中央美院学习油画专业,但毕业后的他并没有选择做一名美术老
  • 华塑科技6月27日快速反弹 实时

    以下是华塑科技在北京时间6月27日13:02分盘口异动快照:6月27日,华塑
  • 汽车太贵、油价太高,印尼国家能源公司宣布将开发电动摩托车电池-焦点热议

    IT之家6月27日消息,据路透社报道,印度尼西亚国家能源公司Pertamina昨
  • 当前快看:尼山论“见”丨张维为:“淄博烧烤”就是最好的山东故事

    00:50海报新闻记者满倩倩丛萍孙靓李义方邢德蕊夏岩松朱铜辉济宁报道世
  • 当前动态:杭州民办小学(含民转公学校)摇号派位比出炉!橙柿互动持续更新中

    今天,杭州各城区陆续发布区内民办小学(含民转公学校)的报名情况。报
  • 匠心家居:6月26日融资买入61.82万元,融资融券余额2318.4万元-热门看点

    6月26日,匠心家居(301061)融资买入61 82万元,融资偿还92 99万元,
  • 雅艺科技:6月26日融资买入86.88万元,融资融券余额2390.01万元

    6月26日,雅艺科技(301113)融资买入86 88万元,融资偿还33 02万元,
  • 最新空间说说语录

    最新空间说说语录1、你是我的安眠药,但偶尔也会失效让我难受又煎熬。2
  • 华中科技大学2023年强基计划入围校考名单结果通知

    根据《华中科技大学2023年强基计划招生简章》及各省反馈的考生高考成绩
  • 华中科技大学2023年强基计划测试方案|焦点消息

    根据《关于在部分高校开展基础学科招生改革试点工作的意见》文件精神和
  • 武汉大学2023年强基计划测试报名通知

    根据我校2023年强基计划招生简章,我校确定了入围学校考核测试资格名单
  • 要闻速递:中国海洋大学2023年强基计划招生考试入围名单公示

    根据教育部和《中国海洋大学2023年强基计划招生简章》的规定,我校对考
  • 东南大学2023年强基计划入围高校考核结果公布

    各位考生:我校2023年强基计划入围高校考核结果已公布,初审通过且确认
  • 华东师范大学2023年强基计划入围名单公布及校测安排的通知_全球视点

    根据华东师范大学2023年强基计划简章要求,学校按不超过分省分专业组招
  • 焦点讯息:北京大学2023年强基计划入围结果查询通知

    北京大学2023年强基计划入围结果和测试安排已经公布,请各位考生登录北
  • 清华大学2023年强基计划入围结果开放查询

    各位考生:我校2023年强基计划入围结果已公布,考生可登录清华大学本科
  • 新生儿可享受哪些医保待遇?报销比例是多少?_新动态

    天津北方网讯:《政民零距离》栏目网民郝**留言:想咨询一下天津市儿童
  • 河南考古又有新发现:精美壁画墓现身郑州

    记者从河南省文物考古研究院了解到,考古工作者在配合郑州航空港区基本
  • 预付年金终值公式推算_预付年金终值公式

    1、这是两种不同的计算方法。2、(1)即付年金终值的计算公式F=A×[(F
  • 临港集团董事长袁国华:上海临港新片区有望成为铂族金属产业未来发展的承载地 天天通讯

    2023上海铂金周-中国铂族金属市场峰会6月27日在上海临港举行。上海临港
  • 港股午评︱人民币汇率回升 港股止跌反弹 恒指升1.56%重回万九关口|快看点

    人民币汇率回升,连续下跌的港股止跌反弹明显,恒指涨1 56%重回万九关
  • 比亚迪秦 PLUS EV 官降 1.2 万!再优惠 5800 元 销量大涨 47%-每日看点

    比亚迪于4月7日推出了秦PLUSEV2023冠军版,其官方售价较2021款下调了0
  • 华为MatePad SE发新款 1499元升级8G内存-当前简讯

    华为今年初发布了MatePadSE10 4平板电脑,当时推出的版本只有4GB+128GB
  • 腾讯回购不停!恒生科技ETF基金(513260)涨超2%!机构:持续看好恒生科技上行动能|世界头条

    6月27日,港股回暖,恒生科技指数在连续4日下跌后迎来久违反弹,指数一

相关推荐

  • 微软推出 ZeRO++技术,可显著减少A
  • 每日讯息!香港证监会行政总裁梁凤仪
  • 中国(广东)-新加坡经贸合作交流会
  • 重庆市气象台发布今年首个高温预警
  • 全球资讯:“请别叫马主任,叫我店
  • 【觉醒榜(井版强度榜)第102期】小
  • 环球简讯:教成年人画画赚钱吗?35岁
  • 华塑科技6月27日快速反弹 实时
  • 汽车太贵、油价太高,印尼国家能源
  • 当前快看:尼山论“见”丨张维为:

阅读排行

  • 建材ETF(159745)涨超1.5% 悦心健康涨超4%|全球今日讯
  • 「口碑前十」嘉兴白癜风专科的医院_世界时讯
  • 天天观察:ai怎么嵌入图片快捷键_ai怎么嵌入图片
  • 全球微资讯!中央纪委国家监委披露监督情况:公私混用的银行账户暗藏猫腻
  • 气体检测仪器行业发展如何?2023年中国气体检测仪器行业深度调研与发展趋势预测研究|全球微动态
  • 女子“房门被邻居封死”后续:开发商把房子买回了_焦点关注
  • 卤虎,佬狮来撕,汽车LOGO“魔改”后太醒脑
  • 聊城市市场监督管理局公布2023民生领域案件查办“铁拳”行动第二批典型案例 全球新动态
  • 百城住宅库存报告出炉 近七成去化周期超14个月|全球看热讯
  • 关于公布哈尔滨工业大学2023年强基计划入围标准的通知

291 32 36@qq.com

Copyright © 1998-2015 by 中国北京网版权 所有 京ICP备12018864号-3

营业执照公示信息