苹果发布 OpenALM 高效语言模型

远山如黛2024-04-25  8

导读:卡饭网 4 月 25 日消息,在 WWDC24 召开之前,苹果公司在 Hugging Face 平台上公开了一款名为 OpenELM的“高效语言模型”,该模型拥有开源的训练与推理框架。 这款语言模型完全开源,它的源代码、预训练模型权重以…

卡饭网 4 月 25 日消息,在 WWDC24 召开之前,苹果公司在 Hugging Face 平台上公开了一款名为 OpenELM 的“高效语言模型”,该模型拥有开源的训练与推理框架。

苹果发布 OpenALM 高效语言模型

这款语言模型完全开源,它的源代码、预训练模型权重以及训练方案都可以从苹果的 Github 仓库中轻松获取。

苹果发布 OpenALM 高效语言模型

OpenELM 采用了层缩放策略,能够有效地管理 Transformer 模型各层的参数分配,进而提升模型的准确率。举例来说,当模型参数量达到约10亿时,OpenELM 相较于 OLMo,其准确率有了2.36%的提升,而所需的预训练 tokens 数量仅为原先的 1/2

展开全文

为您推荐


本文地址: https://www.life0731.com/read-401037.html
免责声明:本文仅代表作者个人观点,与长沙生活网(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表长沙生活网(本网)赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.


相关阅读

最新回复(0)