1342|1

1万

帖子

203

TA的资源

管理员

楼主
 

重磅!"AI界拼多多"发布DeepSeek-V3开源模型,总训练成本557万美元,比肩GPT-4o [复制链接]

12月27日,中国大模型创业公司 DeepSeek 悄悄惊艳了AI 技术圈,重磅发布了一个全新的超大规模模型——DeepSeek-V3

 

这个新模型拥有 6710 亿个参数,但采用了 MOE(混合专家)架构,能根据任务需求激活特定参数,每处理一个词元激活 370 亿参数,从而实现高效又准确的任务处理。

 

DeepSeek-V3 的发布令业界振奋,不仅因为它是开源模型,更因为测试结果显示,它已超越诸如 Meta 的 Llama 3.1-405B、阿里 Qwen 等主流开源模型,甚至在性能上逼近 Anthropic 和 OpenAI 等封闭模型,大大缩小了开源和闭源 AI 之间的差距。

 

目前,DeepSeek-V3的代码已通过 MIT 许可证在 GitHub(

链接已隐藏,如需查看请登录或者注册
)上公开,模型则以公司自有的许可协议提供。同时,也可以在 Hugging Face 平台(https://huggingface.co/deepseek-ai/DeepSeek-V3-Base)体验,但需要遵守公司的许可协议。

感兴趣的小伙伴可以查阅技术论文:

链接已隐藏,如需查看请登录或者注册

 

有小伙伴感兴趣的想玩一玩不?记得整活了来论坛晒一晒哦~~

 

未来是不是会有越来越多的开源模型出现呢?

 

大家对此怎么看呢?

加EE小助手好友,
入技术交流群
EE服务号
精彩活动e手掌握
EE订阅号
热门资讯e网打尽
聚焦汽车电子软硬件开发
认真关注技术本身

最新回复

不知道效果和速率怎么样,确实得测试测试才知道   详情 回复 发表于 2024-12-30 14:12
点赞 关注
个人签名玩板看这里:
https://bbs.eeworld.com.cn/elecplay.html
EEWorld测评频道众多好板等你来玩,还可以来频道许愿树许愿说说你想要玩的板子,我们都在努力为大家实现!

回复
举报

7244

帖子

2

TA的资源

版主

沙发
 

不知道效果和速率怎么样,确实得测试测试才知道

 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/7 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表