高端品牌网-带你领略品牌时尚的前沿

AI公司MosaicML推出300亿参数模型MPT-30B,号称训练成本

发布时间:2023-06-26 14:11 编辑: 来源:IT之家   阅读量:17068   

,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。

图源 MosaicML

MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元,远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。

据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。

除了让 AI 技术更容易获得之外,MosaicML 还专注于提高数据质量并提高模型性能。他们目前正在开发一款工具,可以帮助用户在预训练过程中分层加入特定领域的数据,以确保训练中开业实现多样化和高质量的数据组合。

MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。

IT之家注意到,目前开发者可以从 Hugging Face 下载并使用开源的 MPT-30B 基础模型,开发者还可以在本地硬件上使用自己的数据,对模型进行微调。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关文章 ARTICLE
魅族为旗下PANDAER35W移动电源推出“航宇主题”配色,到手价1

感谢IT之家网友华南吴彦祖的线索投递! ,魅族宣布旗下PANDAER35W便携闪充移动电源10000mAh上新,将提供“PANDAERPASA航宇主题”新配色版本,该版本移动电源将于明天现货开售,到...

来源:IT之家
2023-06-26 13:41
扛鼎企业责任,永倍达将公益使命书写在乡村振兴

6月21日,玉兰成行,蜀葵绽放,一辆辆满载物品的货车,在南召县连绵山峦间的公路上穿梭,把温暖和大爱送给该县5个乡镇敬老院的老人们。 这是陕西永倍达电子商务有限公司在南召开展“远古南召与爱同行”慰问活...

来源:中国网
2023-06-26 13:34
爱夫卡F9S-D商用车诊断仪上市:RK3688芯片+10.1英寸屏,

,爱夫卡F9S-D商用车诊断仪上市,针对柴油、天然气、农机等综合型汽车,适用于大中小型维修企业、培训机构、汽车厂家、维修站、柴油发动机生产厂家、矿山机械、石油化工能源型企业等,售价15500元。 I...

来源:IT之家
2023-06-26 13:29
红魔8SPro手机7月5日发布:《原神》60FPS,170+万分

,IT之家收到红魔游戏手机发放的“录取通知书”,显示红魔8SPro将于7月5日发布。 邀请函显示,红魔8SPro性能跑分超170万分、续航时间超40小时、屏幕触控采样率960Hz、屏占比93.7%,...

来源:IT之家
2023-06-26 13:24
上甲?超级交易者俱乐部杭州站揭牌上甲集团全国城市联盟计划正式启动

6月21日,由上甲-期货交易者平台主办的上甲middot;超级交易者俱乐部杭州站揭牌仪式在杭州余杭区信息大厦举行。多届全国期货大赛冠军、期货大赛长期稳定赢利奖第一名、上甲社区交易明星汪星敏、上甲社区运...

来源:证券之星
2023-06-26 12:51