咨询热线:0755-89999869      政策热线 0755-26978111

DeepSeek思考:含“D”量猛增与AI新技术革命当下

       编者按:“神秘力量弯道超车”“与世界上最先进的闭源模型不分伯仲”“训练成本不到600万美元”“API定价(推理成本)仅是国内其他头部厂商几十分之一”“月访问量达到2.56亿”……
       企业含“D”量(DeepSeek技术的渗透率)的多少,已然被视为与AI连接程度的深浅。一时间,DeepSeek成为AI“技术杠杆”,撬动了产业升级、社会效率提升和全球竞争格局的变化。
       中国AI初创公司深度求索(DeepSeek)在全球范围掀起的AI风暴热度始终未减。产业界将其视为技术变革的引领者,全球云服务提供商竞相将DeepSeek开源模型整合至自身平台中以抢占AI商业先机,用户也争相利用模型权重和输出进行二次开发。资本界因DeepSeek的崛起而震动,甚至引发美国纳斯达克股指下跌,A股连续拉涨,国际资金改善了对中国科技公司的看法。社会各界对DeepSeek的影响力皆予以高度评价,将其看作中国AI崛起的重要象征。
       主要原因在于,DeepSeek打破了此前由美国主导的AI产业游戏规则,由成本降低、技术开源、性能优异等优势带来的AI技术平权应用,极大地推动了新技术革命进程。
       一个AI模型的推出,为什么有这么大的影响力?它究竟影响了什么?DeepSeek的现象级效应是否会引发大规模的AI新技术革命?本文将做系列讨论。

一、DeepSeek创新带来的含AI量猛增





       自DeepSeek上线R1开源模型以来,在全球范围内掀起了一场从技术底层到应用终端的革新浪潮。

       DeepSeek为什么有如此反响?它的出现都影响了什么?
1.创新思路:技术、成本降低门槛
       成本是技术应用普及关键要素之一。《自然》杂志发文称,Meta训练其最新人工智能模型Llama3.1405B耗资超过6000万美元,DeepSeek-V3训练只花了不到十分之一。
       尽管市场对DeepSeek训练成本的数字讨论不一,但无论如何,DeepSeek-V3模型的净算力成本不到600万美元,已经十分高效。
       据“阿里云开发者”分析可知,DeepSeek-V3的训练成本之所以远低于同业,主要是因为其模型架构以及训练架构所决定。包括MLA 机制、FP8 训练以及MoE 架构等,对优化显存占用、节约硬件资源、减少计算复杂度、提升训练速度以及降低能耗等性能都有显著提升。
       另外,芯片的国内稀缺也一直被看作是国内AI发展的禁锢。
       “DeepSeek挑战了人工智能产业在过去一段时间的关键理念,即认为更强大的硬件才是推动人工智能发展的关键。”英国《金融时报》直言。
       其中一个例子,DeepSeek自主研发的 4 - bit 量化技术,使得原本依赖专业级显卡集群支撑的70B大模型,如今可通过消费级硬件实现部署。这种 “瘦身不减智” 的技术路径,让单张 RTX 4090 显卡就能流畅运行130 亿参数模型。
       如此,无论是AI开发者还是个人用户,无需再依赖昂贵的服务器集群,在自己的电脑上就能运行强大的 AI 模型,AI 技术应用门槛得到极大降低。
2.开源生态:诚意开源打破垄断
       技术开源是推动产业升级的关键力量。
       “就算OpenAI 的模型再强,大家也是雾里看山。OpenAI 从 GPT-3 开始就变成了彻头彻尾的 ClosedAI”,知乎作者如是评论。
       经济观察报总结到,相比于以往的开源社区,DeepSeek的开源“诚意满满”。DeepSeek不仅开源了自己最大的 671B R1 模型,还发布了包括1.5B-70B在内的多个流行架构尺寸的蒸馏模型,而且选择了最宽松的 MIT License 协议,允许任何人免费使用、修改、分发,包括用于商业用途。同时,DeepSeek发布的论文及技术报告包含大量技术细节,被称为开源社区里“最详细的技术报告”,拥有相似资源的个人或企业可以按照这一“说明书”复现模型。
       AI从业者将DeepSeek开源策略称为“伟大的平权”,让AI 技术不再是少数巨头的“专利”,而是成为全球开发者的 “共享资源”,加速了 AI 技术在全球范围内的普惠化进程。
3.应用扩散:加速推动AI技术变革
       当下,全球各行各业的含“D”量迅速增长,AI加速新技术变革的进程史前提速。
       DeepSeek-V3 自上线短短一周内,便吸引众多行业巨头纷纷接入。从算力层到应用层,再到端侧 AI,DeepSeek 的崛起带动了 AI 全产业链的高景气度。
       微软将DeepSeek-V3集成到 Azure 云服务中,亚马逊云科技则利用DeepSeek-V3优化其智能客服与推荐系统,英伟达与DeepSeek合作加速模型训练与推理。中国移动、中国电信、中国联通三大运营商也迅速加入,推动5G消息服务、智能运维系统、物联网业务等。
       2月15日,有媒体发现,微信搜一搜在测试接入DeepSeek-R1。腾讯相关人士回应称,微信搜一搜在调用混元大模型丰富AI搜索的同时,近日正式灰度测试接入DeepSeek。据了解,目前腾讯多款产品已接入DeepSeek。2月13日,腾讯AI助手“腾讯元宝”完成更新,同时支持混元和DeepSeek两大模型。另外,腾讯云AI代码助手ima也接入了满血版DeepSeek-R1模型。全民AI时代正加速推进。
4.全球竞争:从技术跟随到规则定义
       ChatGPT出世后很长一段时间,参数几乎成为大模型厂商比拼的最大焦点。
       DeepSeek的出现打破了“参数膨胀”的惯性。不仅通过低成本打破了美国科技巨头的“资本护城河”,其开源策略也将攻下硅谷的“技术护城河”。
       由此也引发了多国限制。近日,美国、意大利、澳大利亚、韩国等国家相继出台政策,对DeepSeek进行限制乃至封杀。彭博社的专栏文章认为,DeepSeek的开源模式使得美国政府难以通过封杀手段限制其影响力,因为其技术和代码已经融入了全球AI社区。
       正如DeepSeek创始人梁文锋所言:“中国的AI不可能永远跟随,需要有人站到技术的前沿。”
       不过,Deepseek公司似乎也有外界看起来的短板。前两日,苹果与阿里确认合作。有报道称苹果此前评估了腾讯、字节跳动、百度、阿里巴巴以及Deepseek开发的模型,最终放弃了DeepSeek,原因是“DeepSeek团队缺乏支持像苹果这样的大客户所需的人力和经验。”

二、AI新技术革命何时到来?





       《变量7:为了不下牌桌的创新》一书中写到,人工智能、电动汽车和新能源,被看作是当下新技术革命的主力军,而决定新技术影响力究竟有多大,最关键要看它能不能找到最广泛的应用场景,是否能给更多行业、更多人赋能。应用实现的那一刻就是新技术革命真正到来的时刻。
       回顾蒸汽时代,火车就是“杀手级”应用。拆解来看,火车实际上“蒸汽机+车厢+轮子+铁轨”的组合。蒸汽机出现以后,当其他所有的组件都凑齐了,只需要等有心人把它们拼起来,火车就问世了。
       前述书中认为,人工智能就是我们这个时代的蒸汽机,它会跟其他组件不断融合、不断溢出,直至改变每个行业、每个人的生活。
       诚然,人工智能正极速推动新一轮科技革命和产业变革。自2022年底ChatGPT引发生成式人工智能的热潮,到2024年初Sora模型以文生视频技术令世界瞩目,再到2025年初DeepSeek以其强大的推理模型震惊了世界。
       然而,我们也要看到,与蒸汽时代不同的是,人工智能当下正面临分化矛盾,因此还无法全面应用、施展潜力。
       实际上,行业内已达成共识,目前人工智能更多是为精英企业和精英个人服务的。精英有行业经验,可以给人工智能当“带路党”,帮人工智能找到它在每个行业的应用场景。精英有广泛的人脉关系,借助人工智能可以进一步放大他们的影响力。精英有现成的事业,有明确的目标,可以直接让人工智能帮忙将本增效。
       因此,即便DeepSeek带来了AI技术平权,也难以立即AI实现使用平权。
       从产业发展现状来看,虽然人工智能在部分领域取得了显著进展,但在更广泛的行业渗透中仍面临挑战。在制造业领域,尽管工信部大力推进 “人工智能 + 制造” 行动,鼓励企业探索智能研发新应用,开发 “人工智能+” 研发设计软件,但要实现全流程智能化以及重点行业智能升级,还需克服技术攻关、软硬件适配等诸多难题。在教育领域,人工智能辅助教学虽有探索,但如何保证学术诚信、合理利用 AI 工具完成教学任务,仍在探索之中。
       不过,我们始终要保持希望,当人工智能成功跨越技术与社会应用之间的鸿沟,真正融入到各个行业,为每一个人带来切实的便利和改变时,我们或许就能见证 AI 新技术革命的全面到来,开启一个全新的智能时代 。
(因篇幅有限,更多详细内容欢迎联系我们)
*深圳市南山科技事务所原创出品,未经授权,不得复制和转载,否则将追究法律责任。


参考资料:
《AI顿悟时刻》,国际金融报
《DeepSeek颠覆了什么?——大模型“国产之光”破局的启示》,经济参考报
《关于DeepSeek的误读与真相》,经济观察报
《漫谈DeepSeek及其背后的核心技术》,阿里云开发者
《变量7:为了不下牌桌的创新》,何帆著



- end -


作      者:壹研南觐

推荐阅读:
宠物数量超过婴幼儿?“它经济”增长潜力与深圳机会分析
反垄断风暴中的英伟达与AI产业生态思考
ChatGPT两年,AI产业发展成什么样了?
火爆全球的ChatGPT是什么来头?
Sora惊艳全球,对具身智能产业影响几何?

eVTOL产业如何国内“起飞”?

低空经济,如何高飞?

深海掘金:解锁海洋经济中的新质生产力

建设全球海洋中心城市,深圳如何做?

内外承压下,日本企业出海政策得失几何?

解读:“以旧换新”叠加海内外降息的背后及应对

中非合作升温,新阶段企业出海要注意什么?
《黑神话:悟空》诞生背后与新质生产力思考
富士康加码河南背后的“产业转移”思考
多城竞夺“自动驾驶第一城”,武汉为什么成了?
上海“总部经济”经验对深圳有何启示?
日本机床从技术落后到跃居世界一流,有何启示?
从竞赛到应用:美国AI创新转化的公私合作实践
王艳梅:深圳新质生产力的创新实践与思考
王艳梅:深中通道促进大湾区产业高质量发展,并非虹吸
深度:美国生物科技政策调整对我国生物医药产业的影响
科技创新从“园”向“城”,深圳方案是什么?
“硬科技”企业孵化新范式,深圳学会多少?
深圳外贸增长详解:六大动能共筑中国“外贸第一城”
深圳策略:抢占低空经济新赛道的着力点

推荐报告:

深圳大健康产业报告:六大领域深度透视与发展策略研究
报告推荐 | 深圳康复养老产业策略研究:现状、问题及建议
报告推荐 | 精准营养时代:国内外产业现状及深圳策略研究
报告推荐 | 抢占精准医疗赛道:深圳产业现状及发展建议
报告推荐 | 起底深圳医疗美容产业:经验借鉴、问题剖析及策略建议
报告推荐 | 深圳“工业上楼”的路径与隐忧:国内外经验、现状分析和潜在问题
  • 网站地图
  • 版权声明
  • 友情链接