AI公司MosaicML推出70亿参数模型MPT-7B-8,号称“一次处
,AI 创业公司 MosaicML 近日发布了其 70 亿参数模型 MPT-7B-8K,据悉,该模型一次可以处理 8000 字文本,相当擅长处理长文重点摘要和问答,还能在 MosaicML 平台上根据特定任务,进一步微调相关配置。
据悉,系列模型采用了 150 万个 Token,并以 256 块 H100 GPU 花 3 天完成模型训练而成。MosaicML 本次发布了 3 个版本模型,包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。
其中,第一个版本 MPT-7B-8k、是以 Transformer 解码器为基础,并以 FlashAttention 和 FasterTransformer 机制来加速训练与推论,能一次处理 8000 字文本,MosaicML 公司表示,该模型开源、允许商用。
第二个版本 MPT-7B-8k-Instruct 是以第一个版本 MPT-7B-8k 微调而成,MosaicML 公司表示,MPT-7B-8k-Instruct 模型可处理长篇指令,特别注重于生成“摘要和问答”,该模型一样开源且可商用。
第三个版本 MPT-7B-8k-Chat 则是机器人对话式的 AI 模型,MosaicML 公司宣称,该模型额外多用了 15 亿个聊天数据 Token,在第一版模型 MPT-7B-8k 之上继续训练而成,该模型开源,但不允许商用。
IT之家此前报道,MosaicML 公司也推出了一款号称训练成本仅为竞品零头的 MPT-30B 开源模型,该公司日前已将所有开源模型发布于 Huggingface 平台,感兴趣的小伙伴们可以前往进行相关了解,还可以在本地硬件上使用自己的数据,在下载后,对模型进行各种微调。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
版权声明:凡注明“来源:“生活消费网”的所有作品,版权归生活消费网 | 专注于国内外今日生活资讯网站所有。任何媒体转载、摘编、引用,须注明来源生活消费网 | 专注于国内外今日生活资讯网站和署著作者名,否则将追究相关法律责任。
-
香港:6月整体出口和进口货值分别同比下跌11.4%及12.3%智通财经APP获悉,7月25日,香港政府统计处发表的对外商品贸易统计数字显示,2023年6月份香港整体出口和进口货值均录得同比跌幅,分别下跌11.4%和12.3%。 继2023年五月份录得15.6%......2023-07-26 12:54
-
GPDWINMini掌机配置公布:最高R77840U可选、7英寸1080感谢IT之家网友上气的线索投递! ,GPD掌机官方公众号今日发文,进一步预告了旗下最新掌机产品GPDWINMini的详细配置。其称,应大量玩家要求,GPD推出了号称“GPDWIN2重制版”的WINM......2023-07-26 12:37
-
世嘉肉鸽动作游戏《ENDLESSDungeon》公布角色介绍,10月19,世嘉开发工作室AmplitudeStudios旗下ENDLESS系列最新作品《ENDLESSDungeon》公布角色介绍短片。该作为Rogue-lite战术动作游戏,将于10月19日在PS4/5、X......2023-07-26 12:33
-
前锤子科技COO吴德周发布AR眼镜ARknovvA1:可创作、可导航、可感谢IT之家网友Monsterwolf的线索投递! ,今晚AR科技企业致敬未知举办了主题为“你看到的世界只有1/2”的首场线上新品上市发布会,创始人兼CEO吴德周公布了全新AR品牌ARknovv,并......2023-07-26 12:21
-
安耐美ENERMAX海外推出AQUAFUSIONADVAIOCPU散热器,ENERMAX近日推出AQUAFUSIONADV系列AIOCPU散热器白色款式,目前该系列散热器共有6种款式,包括120mm、240mm和360mm版本,每种都有黑白两种配色。 IT之家汇总该系列......2023-07-26 12:15