爱芯通元NPU完成Llama 3和Phi-3大模型适配，推动AI大模型技术应用普及 - OFweek电子工程网

当前位置： OFweek 电子工程网 > 正文

爱芯通元NPU完成Llama 3和Phi-3大模型适配，推动AI大模型技术应用普及

2024-04-28 15:22

OFweek电子工程网

中国 2024年04月28日——人工智能芯片研发及基础算力平台公司爱芯元智宣布，近日，Meta、Microsoft相继发布具有里程碑意义的Llama 3系列和Phi-3系列模型。为了进一步给开发者提供更多尝鲜，爱芯元智的NPU工具链团队迅速响应，已基于AX650N平台完成 Llama 3 8B和Phi-3-mini模型适配。

Llama 3

上周五，Meta发布了Meta Llama 3系列语言模型（LLM），具体包括一个8B模型和一个70B模型在测试基准中，Llama 3模型的表现相当出色，在实用性和安全性评估中，与那些市面上流行的闭源模型不相上下。

在架构层面，Llama 3选择了标准的仅解码（decoder-only）式Transformer架构，采用包含128K token词汇表的分词器。Llama 3使用了超过15T的公开数据进行训练，其中5%为非英文数据，涵盖30多种语言，训练数据量是前代Llama 2的七倍。

根据Meta的测试结果，Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct，70B模型则超越了名声在外的闭源模型Claude 3的中间版本Sonnet，和谷歌的Gemini Pro 1.5相比三胜两负。

实际上板结果：目前AX650N已经完成了Llama 3 8B Int8版本的适配，若采用Int4量化，每秒token数还能再翻一倍，能满足正常的人机交流。

Phi-3

Llama 3刚发布没多久，竞争对手就来了，而且是可以在手机上运行的小体量模型。

本周二，微软发布了自研小尺寸模型Phi-3。尽管Phi-3-mini被优化至可部署在手机上，但它的性能可以与Mixtral 8x7B和GPT-3.5等模型相媲美。微软表示，该创新主要在于用了质量更好的训练数据集。

实际上板结果：目前AX650N已经完成了Phi-3-mini Int8版本的适配，已能满足正常的人机交流。

其他成果

AX650N能第一时间完成Llama 3和Phi-3的适配，源于今年以来相关团队悄悄完成了现有NPU工具链针对大语言模型的支持和调优。目前除了Llama 3之外，已经完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等国内外主流的开源大语言模型适配。

后续计划

今年是AIPC的元年，爱芯元智将针对AIPC的常见应用提供更多的解决方案。充分发挥爱芯通元NPU高能效比的技术优势，让各种有趣的大模型实现高性价本地化部署，做到“人人都用得起大模型”，深入实践“普惠AI，造就美好生活”。

原文标题 : 爱芯通元NPU完成Llama 3和Phi-3大模型适配，推动AI大模型技术应用普及

本地收藏打印推荐给朋友

声明： 本文系OFweek根据授权转载自其它媒体或授权刊载，目的在于信息传递，并不代表本站赞同其观点和对其真实性负责，如有新闻稿件和图片作品的内容、版权以及其它问题的，请联系我们。

发表评论

共0条评论，0人参与

立即登录即可访问所有OFweek服务

忘记密码

其他方式

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

行业报告

最新活动更多

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

电子工程猎头职位更多

电子工程师广东固特超声股份有限公司

高级软件工程师广东省/深圳市
自动化高级工程师广东省/深圳市
光器件研发工程师福建省/福州市
销售总监（光器件）北京市/海淀区
激光器高级销售经理上海市/虹口区
光器件物理工程师北京市/海淀区
激光研发工程师北京市/昌平区
技术专家广东省/江门市
封装工程师北京市/海淀区
结构工程师广东省/深圳市

扫码关注公众号
OFweek电子工程网
获取更多精彩内容

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号