873|7

687

帖子

0

TA的资源

纯净的硅(高级)

楼主
 

向梁文锋学习 [复制链接]

DeepSeek创始人梁文锋的采访,振聋发聩,一定要认真看完!

下面是关于DeepSeek创始人梁文峰的一段采访,我看得热泪盈眶,看了好几遍仍感觉振聋发聩,久久不能平静。

记者:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

点赞 关注(1)
 
 

回复
举报

687

帖子

0

TA的资源

纯净的硅(高级)

沙发
 
创新,就是要摆脱惯性。
一个2023年成立的公司。
2023年5月,38岁的梁文锋宣布要做通用人工智能(AGI)。
2023年7月,梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司。
梁文锋被认为是量化投资者投身AI创业的“第一人”,实际上在幻方创业时,梁文锋的公司也早就用上了AI技术。

一个纯粹的本土研发团队,只有中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人。
甚至有报道称深度求索(DeepSeek)团队不招聘高级技术专业人员。员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。
你最好没学术荣誉,没有发很多论文,没有这个那个。
但你要有热爱、有信仰。
公司管理不设KPI,鼓励员工自由发挥。
最不容易的,是这些全部开源,与openAI完全不同。外网都在评价,这才是真正继承了OpenAI最初使命和火种的团队。
就是,我们在如此困难的环境之下,用极低的成本,做成了吊打人家几百亿烧钱的水准。

OpenAI创始成员Andrej Karpathy在看到DeepSeek的成绩之后,毫不吝啬地表达了赞赏,他认为深度求索(DeepSeek)在资源受限的情况下展现出了极高的研究和工程能力。
这不禁让我想起了钱学森说的,中国人有什么不行呢?
也不禁让我想起,西方到底还有多少杜撰的“童话”,在束缚我们的脑子。
不论是六代机、新武器、登月计划、量子,我们越来越发现,原来,西方人好多东西是吹牛逼啊,没那么厉害啊。
它最容易的就是,给你画一个思想的牢笼,让你就呆在里面。
但是,中国人证明了,自己是可以的。
梁文锋是很早以前就意识到这件事的人:
中国必然需要有人站到技术的前沿。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。
我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。
我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。真正的差距不是一年或两年,而是原创和模仿之差。
从现在起,谁敢再说中国大模型抄袭美国?谁敢再说中国大模型落后美国X年?
不是要去强调自己有多牛逼,实事求是地讲我们必须要正视和美国的科技差距,不要盲目自信。但个人觉得,当下这件事最大的意义,是戒了心里的鸦片,很多人总是觉得我们自己不行,我们中国人,就要搞自己的原创。
谁说我们0—1不行?
随着特朗普的上台,西方文明的童话、神话,正在一点一点破灭,我相信全世界都在感受这场巨大的变局。
相信自己,因为,童话里都是骗人的。
最后,附上梁的访谈(原文摘作者:阮一峰),我们每个人,都要好好看看,中国人也可以搞战略研究和实践。
(1)我们要做的不是生成式 AI,而是通用人工智能 AGI。前者只是后者的必经之路,AGI 会在我们有生之年实现
(2)任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。
(3)在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。
(4)我们不会闭源。我们认为先有一个强大的技术生态更重要。
(5)当前阶段是技术创新的爆发期,而不是应用的爆发期。大模型应用门槛会越来越低,创业公司在未来20年任何时候下场,也都有机会。
(6)过去很多年,很多的中国公司习惯了别人做技术创新,拿过来做应用变现,自己等着摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是一直搭便车
(7)大部分中国公司习惯 follow,而不是创新。中国创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才。我们没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。
(8)我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。
(9)我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。
(10)我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。
(11)中国产业结构的调整,会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气,现在赚不到了,就会更愿意俯身去做真正的创新。

(12)我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多,因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。#图文创作激励计划#

个人签名

东莞市莞城中振仪器经营部 振动试验仪器销售和技术服务

 
 
 

回复

687

帖子

0

TA的资源

纯净的硅(高级)

板凳
 

DeepCeek梁文锋访谈录,20个深度访谈问题汇总

 耕读传家V 2025-02-01   |  9阅读  |  3转藏

转藏全屏朗读分享

一、创新理念与商业化策略

1. 为什么中国公司包括不缺钱的大厂,这么容易把快速商业化当作第一要义?

梁文峰:过去30年,中国商业发展着重强调盈利,对创新重视不足。创新不单纯由商业利益驱动,好奇心与创造力同样关键。这是过去发展惯性导致的阶段性现象,如今我们正逐渐突破这种束缚。

2. 作为一个商业组织,DeepSeek选择创新并通过开源分享出去,如何形成自己的护城河?

梁文峰:在颠覆性技术面前,闭源形成的护城河难以持久。DeepSeek将价值沉淀于团队,促使成员在实践中成长,积累经验,塑造创新的组织文化,此为我们的核心竞争力。开源不仅是技术行为,更是文化体现,能带来额外荣誉。

3. DeepSeek在技术创新上有哪些独特举措?

梁文峰:我们提出了MLA架构和DeepSeek MoE Sparse结构等模型架构创新,还创建轻量级分布式训练框架,显著提升资源利用效率,例如15亿参数模型训练仅需128张英伟达A100芯片及7天时间。

4. 如何看待创新与商业化之间的平衡关系?

梁文峰:创新不应仅聚焦短期商业利益,要从长远视角考量,为技术发展奠定基础。虽短期内商业化可能带来收益,但长期看,持续创新才是保持竞争力的关键,DeepSeek通过开源促进技术进步,也为自身发展营造良好生态。

二、中国AI产业发展

5. 中国AI与美国的差距究竟体现在哪些方面?

梁文峰:表面上中国AI与美国有一两年技术差距,实则根源在于原创与模仿的差异。中国若想改变地位,需有人站在技术前沿,在生态建设、人才培养、资本投入等方面协同发力。

6. 中国AI产业要实现跨越式发展,需要在哪些方面做出努力?

梁文峰:需加强基础研究投入,鼓励原创思维,培养顶尖人才。同时,构建完善的产业生态,促进产学研深度融合,资本也应更具耐心,支持长期创新项目。

7. 现在经济进入下行周期,资本也进入冷周期,这对原创式创新是否会带来更多抑制?

梁文峰:我认为未必。中国产业结构调整对硬核技术创新需求增大,当人们意识到过往赚快钱多靠运气,便会更愿意投身真正的创新。

三、DeepSeek团队与人才

8. 听说DeepSeek很擅长从细节招人,能详细介绍一下你们的选人标准吗?

梁文峰:我们以热爱和好奇心为重要选人标准,秉持“看能力,不看经验”理念。发现很多人对研究的渴望远超对金钱的追求,这类人才是我们所需。

9. DeepSeek的团队组建模式和组织架构是怎样的?

梁文峰:团队组建看重人才内在特质。组织架构自下而上,一般不强制分工,而是自然分工。成员基于兴趣和能力自发组合,有潜力的想法会获得自上而下的资源调配。

10. 外网说DeepSeek雇佣了“一批高深莫测的奇才”,做出DeepSeek v2的究竟是些什么人?

梁文峰:并非所谓“奇才”,团队主要由顶尖高校应届毕业生、未毕业的博士四年级、五年级实习生以及毕业没几年的年轻人构成,他们凭借自身能力和热情投入研发。

11. 很多大模型公司都去海外挖人,有人觉得这个领域前50名的顶尖人才可能都不在中国,DeepSeek的人从哪里来?

梁文峰:V2模型团队成员均为国内培养,无海外归来人员。尽管前50名顶尖人才可能不在国内,但我们有信心自主培养出顶尖人才。

四、技术认知与开源

12. 对技术真的可以拉开差距吗?

梁文峰:技术本身无秘密,但重置技术需耗费大量时间和成本。如英伟达显卡,理论虽易理解,但重新组织团队、追赶下一代技术面临诸多困难。

13. 如何看待技术开源对行业发展的意义?

梁文峰:技术开源是推动行业进步的重要力量,能促进知识共享与协作,加速技术创新。DeepSeek坚信AI技术应普惠,开源作为文化行为,能让更多人受益,推动行业整体发展。

14. DeepSeek开源的技术成果对自身和行业会产生哪些影响?

梁文峰:对自身而言,开源有助于吸引更多人才参与,完善技术生态。对行业来说,能为其他开发者提供借鉴,加速技术应用和创新,推动整个AI行业发展。

五、AI行业趋势与竞争

15. 如何看待AI行业未来的发展趋势?

梁文峰:AI生成内容将从专业领域拓展到日常应用,随着技术迭代,AI工具便捷性提升,文生图、图生文等将成为日常工作和创作的一部分。

16. DeepSeek在与其他大厂和创业公司的竞争中,如何突出自身优势?

梁文峰:我们以技术创新和产品优化为核心,走“小力出奇迹”路线,通过硬件和训练方法创新,降低成本同时提升性能,形成性价比优势。

17. 面对OpenAI的指责,DeepSeek如何回应?

梁文峰:DeepSeek技术是团队多年自主研发成果,核心技术经公开论文及专利验证,我们愿意接受第三方技术审计以证清白。

六、DeepSeek商业模式与AGI探索

18. DeepSeek的商业模式与盈利规划是怎样的?

梁文峰:目前暂未明确披露详细规划,但开源和低成本赋予我们市场优势,未来可能围绕技术服务、产品应用等探索商业价值。

19. 为什么DeepSeek只做研究探索,不做模型和应用?

梁文峰:当下全球创新浪潮火热,我们期望参与其中。以往中国公司习惯利用他人技术创新成果做应用盈利,并非长久之计。此次我们志在技术前沿,推动行业发展。

20. 对AGI的理解和探索,DeepSeek有哪些行动?

梁文峰:实现AGI需研究新模型结构,在有限资源下提升模型能力。DeepSeek持续探索,如推出的Janus - Pro模型在多模态等方面表现出色。

个人签名

东莞市莞城中振仪器经营部 振动试验仪器销售和技术服务

 
 
 

回复

687

帖子

0

TA的资源

纯净的硅(高级)

4
 

其实就是任正非之前提出的中国科技人员要向上捅破天,向下要扎入地。

跟在美国后面这么多年了,我们现在应该有这个实力了。

个人签名

东莞市莞城中振仪器经营部 振动试验仪器销售和技术服务

 
 
 

回复

687

帖子

0

TA的资源

纯净的硅(高级)

5
 

我在视频上看了 DPS的应用,有解决问题的推理过程,确实是个好的辅导老师了,登陆了DPS的官网,无法进行对话,点击后就是新的空白网页,

要怎么才能应用DPS呢

个人签名

东莞市莞城中振仪器经营部 振动试验仪器销售和技术服务

 
 
 

回复

687

帖子

0

TA的资源

纯净的硅(高级)

6
 

中国初创企业“幻方”公司研发的新的中国式AI大模型,瞬间震动了美国的硅谷大佬们,其感觉不亚于经历了一场大地震:让美国科技公司一度引以为豪的AI 科技壁垒,突然间被破防。正当这些美国科技精英们陶醉于他们的技术金字塔尖,欣赏四海美景的美梦之中时,一股来自东方的神秘力量,刺穿了一直用来裹身的漂亮外膜时,他们感到了丝丝寒意:来自中国的神秘力量,让他们感到紧张,感到猝不及防,感到心有余悸。扎格博克连夜召开专家开会研究对策,寻找应对策略。世界科技界睁大眼睛,严阵以待,等待一场可能的“AI”大战拉开序幕。

DeepSeek 已经成为DeepShake,由“”深度探索”,转为“深度震动”。

人们感到好奇的是,究竟是什么如此震动了美国科技界呢?是中国的海量资金大投入?还是中国的人海战术占了上风?抑或是中国的研发时间大大超过美国的投入?

如果“幻方”公司真的在上述三个领域有超过美国公司的投入的话,美国科技界对“幻方”公司今天的成果,是不会收到震动的,会认为是理所当然的结果。

然而,让美国同行们感到震动的恰恰是最残酷的事实,也是最让他们感到大脸的是,中国“幻方”公司的资金,时间,人力的三大投入,都远比美国同行们低了许多:美国花了数千亿美金,用了数千人团队,花了数年的大投入,才完成其AI 大模型,“幻方”只用了640 万美元,不到140人的团队,集中了1-2年的时间,让DeepSeek 问世。它的问世,不像美国AI Open 那样大张旗鼓,声势浩大,宣传铺天盖地,而是显得过于低调,甚至有些漫不经心,又有点不经意间泄露于世。或许正是因为,如此低调,低姿态,反而引起海啸般震动:DeepSeek 一夜之间让世界知道了它,不仅是科技界,连总统,国家政要都纷纷表示关注。

最让美国那些科技公司大佬们尴尬的事情是:他们几年里依靠把AI弄得玄乎其神,以此来吸纳天量的投资者,依靠天量资金干成了一个根本不需要这么多钱的项目,这令投资者者,市场应用者有一种被骗,被忽悠的感觉。同时用“开源”,“闭源”,等概念,让非专业投资人一头雾水,两眼一抹黑,只是投,投,投。钱,被谁赚走了,无人给出准确答案。

这个案例有点像中国的一个民间故事:一个人身上发痒,求教医生,医生给他做了各种检查,抽血验血,有做了过敏试验,忙了半天,没有结论,只是说了句可以概括一切病因的“免疫力下降”,就不管了。求医者,投入不少,一无所获。结果再医院门口一个保安给出“秒方”:挠挠,可以解痒。

现在美国的OPEN-AI 发明者们似乎正面临市场的“信任危机”,市场要对有关研究公司进行“审计”:你们究竟花了多少投资人的钱,到底都花哪里去了?是项目真的那么昂贵呢,还是有人故意让项目变得神秘,让市场误认为,投多少钱都要合理的?是否有人在中饱私囊?人们在怀疑其中的真实内幕。

因为中国的DeepSeek 给出了截然相反的样板:用最直白的方式“挠挠”,就解决了问题。

现在不少西方科技界和政治家都十分好奇:中国企业是怎么取得这样的技术突破的,在西方对中国技术如此如此密不透风的封锁面前是如何发展的呢?

其实,这一切也没有什么奥秘,中国企业就是坚持走自己发展的道路,遵循了一条简单而有效的途径:你打你的,我打我的,大路朝天,各走一边。只要能够实现目标,万般皆是机会。

而让美国科技界感到跌面子的还是,美国科技界有人有意无意的故意把AI技术神秘化,给世人一种高不可攀,特别是暗示中国科技界短期内不可能有所突破,什么领先中国X年,什么中国可能永远望其项背不可逾越什么什么的,气势可谓汹汹给人一种故弄玄虚的感觉。但是,DeepSeek的横空出世,似乎用最温柔,又最彻底的刺破了当代一个最大的“幻影”:AI 技术的基础逻辑,并非那么神秘,更不是只有美国人才能掌控的技术。中国走自己的研发思路,一定会继续创造新的惊喜:DeepSeek 只是个开始可以再发展为DeepShake 再发展为DeepBreak ……

不久前,我们呼吁中国一定会有自己的CAI (Chinese AI 中国的人工智能)技术问世,现在DeepSeek 不负众望,应运而生,给中国的蛇年大吉增光添彩 !

DeepSeek 成为 DeepShake,肯定可以重塑科技领域的版图,随着中国“”幻方量化”的成熟,崛起,一定会让中国的科技“神秘力量”把被西方少数科技公司故意垄断需要付大价钱才能运用的而被高高挂起的“贵族”高科技转变为平民工具,是对现代科技文明的最大贡献 !

未来“探索”的道路还很长,DeepSeek 绝不会是终点,DeepBreak , DeepShake 将彻底改变世界科技发明的格局!

(本文作者刘志勤系中国人民大学重阳金融研究院高级研究员)

 
 
 

回复

687

帖子

0

TA的资源

纯净的硅(高级)

7
 
闂佸搫琚崕鍐诧耿閸涙潙瀚夋い鎺嗗亾缂佹锕㈠畷妤呭Ω閳轰礁濮ら柣鐘遍檷閸斿繘顢欓幋锔芥櫖鐎光偓閸愭儳娈�闂佽皫鍡╁殭缂傚稄鎷�闂佺懓鐡ㄩ悧鐐哄焵椤掑﹥瀚�濠电偛顦崝宀勫船閿燂拷
 
 
 

回复

687

帖子

0

TA的资源

纯净的硅(高级)

8
 
闂佸搫琚崕鍐诧耿閸涙潙瀚夋い鎺嗗亾缂佹锕㈠畷妤呭Ω閳轰礁濮ら柣鐘遍檷閸斿繘顢欓幋锔芥櫖鐎光偓閸愭儳娈�闂佽皫鍡╁殭缂傚稄鎷�闂佺懓鐡ㄩ悧鐐哄焵椤掑﹥瀚�濠电偛顦崝宀勫船閿燂拷
 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/10 下一条
立即报名 | 2025 瑞萨电子工业以太网技术日即将开启!
3月-4月 深圳、广州、北京、苏州、西安、上海 走进全国6城
2025瑞萨电子工业以太网技术巡回沙龙聚焦工业4.0核心需求,为工程师与企业决策者提供实时通信技术最佳解决方案。
预报从速,好礼等您拿~

查看 »

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表