|簡體中文

比思論壇

 找回密碼
 按這成為會員
搜索



查看: 747|回復: 0
打印 上一主題 下一主題

可提升模型的训练和推理效率

[複製鏈接]

271

主題

0

好友

1485

積分

高中生

Rank: 4

  • TA的每日心情
    開心
    前天 23:11
  • 簽到天數: 253 天

    [LV.8]以壇為家I

    推廣值
    0
    貢獻值
    0
    金錢
    512
    威望
    1485
    主題
    271
    跳轉到指定樓層
    樓主
    發表於 2023-5-10 11:33:41 |只看該作者 |倒序瀏覽
    当地时间4月12日,微软宣布开源系统框架DeepSpeed Chat,帮助用户训练类似于ChatGPT的模型。与现有系统相比,DeepSpeed Chat的速度快15倍以上,可提升模型的训练和推理效率。
    ChatGPT是OpenAI于去年11月推出的聊天机器人,其训练基础是为RLHF(Reinforcement Learning from Human Feedback),即基于人工反馈进行强化学习。
    对于想要开发类似于ChatGPT模型的研究人员而言,难题之一是市面上缺乏支持端到端的RLHF系统框架。为此,微软开源其系统框架DeepSpeed Chat,帮助数据科学家和研究者更易于使用ChatGPT类型的模型。
    据介绍,DeepSpeed Chat能够简化ChatGPT类型模型的训练过程、强化推理体验。其中的DeepSpeed-RLHF系统能够在推理和训练两种模式之间进行切换,使复杂的RLHF训练速率更快、易于大规模推广。
    根据微软,DeepSpeed-HE比现有系统快15倍以上,且成本更低。在微软云Azure上,该系统只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个OPT-30B模型,且这两种训练分别花费不到300美元和600美元(OPT为脸书母公司Meta发布的语言模型)。
    此外,面对于拥有1750亿参数的模型,DeepSpeed-HE的训练时间只需不到一天的时间。
    对于微软开源DeepSpeed Chat,海外知名科技社区Hacker News的用户总结道,微软不仅向OpenAI投资了100亿美元,同时还为公众提供一种免费工具,帮助他们研发OpenAI同款产品。也有用户认为,微软选择开源DeepSpeed Chat,是为了在业内获得领先优势。
    还有用户认为这一系统框架前景可期,“我可以预见,未来每家公司都会拥有自己的‘AI模型助理’,其能够定期对公司内部数据进行培训或更新。公司的电子邮件、slack/team消息、文档等或许都将成为AI模型的数据来源。”
    微软和OpenAI的合作可以追溯到2019年,在这一年OpenAI获得了微软10亿美元的投资,并对微软独家授权部分AI技术,双方合作替微软云Azure开发人工智能技术。
    今年2月初,微软推出搭载ChatGPT同源功能的新版必应(Bing),使得该软件的全球下载量在一夜之间猛增10倍,并蹿升至苹果App Store应用商店最受欢迎的免费应用榜中的第十位。

    您需要登錄後才可以回帖 登錄 | 按這成為會員

    重要聲明:本論壇是以即時上載留言的方式運作,比思論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,讀者及用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,讀者及用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本論壇受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者及用戶發現有留言出現問題,請聯絡我們比思論壇有權刪除任何留言及拒絕任何人士上載留言 (刪除前或不會作事先警告及通知 ),同時亦有不刪除留言的權利,如有任何爭議,管理員擁有最終的詮釋權。用戶切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。

    手機版| 廣告聯繫

    GMT+8, 2024-12-21 06:39 , Processed in 1.034985 second(s), 25 queries , Gzip On.

    Powered by Discuz! X2.5

    © 2001-2012 Comsenz Inc.

    回頂部