国内首个类ChatGPT模型:复旦大学MOSS今日正式开源,超100万条
感谢IT之家网友 Colorful M 的线索投递!
,复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。
目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。
据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。
MOSS 来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的 AI 同名,已发布至公开平台,邀请公众参与内测。
MOSS 用例:
-
moss-moon-003-base: MOSS-003 基座模型,在高质量中英文语料上自监督预训练得到,预训练语料包含约 700B 单词,计算量约 6.67x1022 次浮点数运算。
-
moss-moon-003-sft: 基座模型在约 110 万多轮对话数据上微调得到,具有指令遵循能力、多轮对话能力、规避有害请求能力。
-
moss-moon-003-sft-plugin: 基座模型在约 110 万多轮对话数据和约 30 万插件增强的多轮对话数据上微调得到,在 moss-moon-003-sft 基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。
-
moss-moon-003-pm: 在基于 moss-moon-003-sft 收集到的偏好反馈数据上训练得到的偏好模型,将在近期开源。
-
moss-moon-003: 在 moss-moon-003-sft 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型,具备更好的事实性和安全性以及更稳定的回复质量,将在近期开源。
-
moss-moon-003-plugin: 在 moss-moon-003-sft-plugin 基础上经过偏好模型 moss-moon-003-pm 训练得到的最终模型,具备更强的意图理解能力和插件使用能力,将在近期开源。
-
moss-002-sft-data: MOSS-002 所使用的多轮对话数据,覆盖有用性、忠实性、无害性三个层面,包含由 text-davinci-003 生成的约 57 万条英文对话和 59 万条中文对话。
-
moss-003-sft-data:moss-moon-003-sft 所使用的多轮对话数据,基于 MOSS-002 内测阶段采集的约 10 万用户输入数据和 gpt-3.5-turbo 构造而成,相比 moss-002-sft-data,moss-003-sft-data 更加符合真实用户意图分布,包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数,约含 110 万条对话数据。目前仅开源少量示例数据,完整数据将在近期开源。
-
moss-003-sft-plugin-data:moss-moon-003-sft-plugin 所使用的插件增强的多轮对话数据,包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约 30 万条多轮对话数据。目前仅开源少量示例数据,完整数据将在近期开源。
-
moss-003-pm-data:moss-moon-003-pm 所使用的偏好数据,包含在约 18 万额外对话上下文数据及使用 moss-moon-003-sft 所产生的回复数据上构造得到的偏好对比数据,将在近期开源。
MOSS 的 GitHub 页面:点此查看
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
版权声明:凡注明“来源:“生活消费网”的所有作品,版权归生活消费网 | 专注于国内外今日生活资讯网站所有。任何媒体转载、摘编、引用,须注明来源生活消费网 | 专注于国内外今日生活资讯网站和署著作者名,否则将追究相关法律责任。
-
探路者拟收购国外芯片设计公司芯片板块收入占比有望提高2023年3月30日晚间,探路者发布公告称,公司拟以自有资金3852.02万美元收购国外触控芯片公司G2Touch72.79%的股权。 2021年9月,探路者收购了北京芯能60%股权,标志着探路者正......2023-04-21 14:15
-
vivoPad2安卓平板发布:12.1英寸屏+天玑9000,2399元起,vivoPad2安卓平板今日正式发布,搭载12.1英寸屏和天玑9000处理器,首发2399元起。 8GB+128GB:首发2399元 8GB+256GB:首发2799元 12GB+......2023-04-21 14:00
-
《高级战争1+2复刻版》4月21日登陆任天堂Switch平台,《高级战争1+2复刻版》是一款由WayForward开发,任天堂发行的回合制策略游戏,将于4月21日正式发售,目前已经可以在SwitcheShop上预订,售59.99美元。不过很可惜,这款游戏暂无亚......2023-04-21 13:57
-
微星RTX3060Ti“超龙”高端显卡即将推出,仅供中国香港/台湾地区,微星日前公布了新款GeForceRTX3060TiSUPER3X8GD6XOC显卡,采用了超龙外观。这款显卡不会大范围上市,仅供中国香港和中国台湾地区。 超龙是微星显卡的旗舰型号。消息称,微星RT......2023-04-21 13:52
-
拉勾招聘:25%AIGC算法工程师岗位月薪超68K,超4成数字科技人才在,拉勾招聘发布《2023第一季度AIGC人才供需报告》显示,2023年3月,AIGC人才岗位需求量环比增加42%,其中,25%的AIGC算法工程师岗位月薪超68K。 《报告》显示,今年以来,AIGC......2023-04-21 13:37