(资料图片仅供参考)
编程客栈()5月11日 消息:MosaicML 的 MPT-7B 是一个具有近70亿个参数的大型语言模型,该团队在自己的近万亿个标记的数据集上对其进行了训练。
MosaicML 遵循 Meta 的LLaMA模型的训练方案。培训花费近200,000美元,使用 MosaicML 平台耗时9.5天。
MosaicML表示,MPT-7B 与 Meta 的70亿参数 LLaMA 模型的性能相匹配,使其成为第一个达到该水平的开源模型,领先于OpenLLaMA。与 Meta 的模型不同,MPT-7B 已获得商业使用许可。
除了“MPT-7B Base”模型,MosaicML 还发布了三个变体:MPT-7B-StoryWritpythoner-65k+、MPT-7B-Instruct 和 MPT-7B-Chat。
借助 MPT-7B-StoryWriter-65k+,MosaicML 还发布了一个模型,该模型能够读取和写入上android下文长度非常长的故事。为此,使用 books3数据集的子集对 MPT-7B 进行了微调,上下文长度为65,000个标记。OpenAI 最大的 GPT-4变体能够处理32,000个标记。
根据 MosiacML 的说法,该模型可以通过js一些优化扩展到超过65,000个token,并且该团队已经在使用 Nvidia A100-80GB GPU 的单个节点上展示了多达84,000个token。但即使有65,000个tokenjs,也可以阅读整部小说并写一篇结语。
项目网址:https:/php/github.com/mosaicml/llm-foundry
X 关闭
-

星巴克正式发布2025中国战略愿景 新增3000家门店
9月14日,星巴克正式发布了2025中国战略愿景。据悉,星巴克在中国内地的门店即将在2022财年底达到6000家,注册会员数达到8500万人,其中在
-

2021年国家开发银行全年发放贷款5948亿元支持乡村振兴
2021年,国家开发银行全年发放贷款5948亿元,重点支持产业发展、易地搬迁后续发展、东西部协作、农业现代化、农村基础设施等重点领域发展,
-

国家知识产权局出台推动知识产权高质量发展年度工作指引(2022)
国家知识产权局近日印发《推动知识产权高质量发展年度工作指引(2022)》(以下简称《工作指引》),提出到2022年底,知识产权强国建设工作机制
-

中国六部门印发加强中央财政衔接推进乡村振兴补助资金使用管理的指导意见
21日,财政部、农业农村部、国家乡村振兴局、国家发展改革委、国家民委、国家林草局六部门印发《关于加强中央财政衔接推进乡村振兴补助资金

