2月6日,DeepSeek概念股继续上涨,截至发稿,Wind DeepSeek指数涨超5%,航锦科技(维权)、美格智能、浙江东方、每日互动、优刻得、杭钢股份、青云科技一字晋级,安凯微、天娱数科盘中分歧后同步涨停。A股多家上市公司发布已接入或正在对接DeepSeek模型。
此外,国产半导体板块涨幅居前。调研机构认为,在端侧AI应用需求增长的带动下,AIoT芯片公司有望迎来进一步的业绩增长。
中信证券发布研报称,DeepSeek V3及R1大模型以其低成本+高性能+开源等特点引发全球关注,通过模型层面创新,在芯片受限与低算力投入的背景下,达到全球顶尖闭源模型的性能水平,属于生态级突破,有望带动国内AI全产业快速发展,同时其开源与低成本特性也有望赋能AI应用厂商,加速推动端侧AI落地。
重塑AI生态
DeepSeek通过重塑开源大模型生态,吸引了更多开发者和企业参与到开源大模型的建设和应用中。
一方面,DeepSeek通过采用MIT许可协议(麻省理工学院许可证,一种宽松的开源软件许可证),支持免费商用、任意修改和衍生开发。Meta首席AI科学家Yann LeCun表示,DeepSeek的成功得益于开放生态,创新基于前人成果的持续迭代,显示出开源模型正在超越闭源系统。
为了追赶生态建设,谷歌DeepMind CEO Demis Hassabis在谷歌发布2.0系列产品后发文表示:通过不断提高质量与降低成本,(团队)取得了令人兴奋的进展。2.0系列是成本与性能方面的领先模型,所有人都可以使用Gemini 2.0强大的推理能力和多模态功能,这也为谷歌未来的自主智能体研究奠定了基础。
360集团创始人、董事长周鸿祎今日表示,DeepSeek刺激了全球其他开源团队,大家你追我赶。同时在DeepSeek公开的技术原理上产生新的思考。
另在性价比方面,面壁智能联合创始人兼首席科学家刘知远表示,DeepSeek V3的重要启示在于,它展示了如何用1/10甚至更少的成本达到GPT-4和GPT-4o水平。原因上,DeepSeek V3在底层算力加速方面做了大量工作,实现算法和底层软硬件的协同优化。这种一体化优化机制让行业看到,即使成本已很低,仍可通过优化进一步降低成本。“虽然V3的成本仍是几百万美元甚至几千万美元,但相比国际公认水平已经低得多,这也是英伟达股价下降的一个重要原因。”刘知远表示。
DeepSeek的生态繁荣除了上述要素,还包括开发者工具与平台、提供高性能计算与硬件支持的计算平台。绕过英伟达并行计算平台和编程模型CUDA,DeepSeek团队部署了定制化PTX(Parallel Thread Execution)平台,提升硬件适配灵活性,加速训练任务,同时可以优化其他GPU平台,如1月25日,AMD宣布将DeepSeek V3集成到其MI300X GPU中;2月1日,硅基流动与华为云联合推出基于昇腾云的DeepSeek-R1&V3推理服务,可获得持平全球高端GPU部署模型的效果;2月2日,DeepSeek两款模型完成海光DCU适配并上线,国产芯片与DeepSeek系列模型实现无缝衔接。
AMD董事长兼CEO苏姿丰此前表示,DeepSeek使行业出现用更少基础设施来实现训练和推理能力的新方法,这是件好事,这也使AMD能够继续在更广泛的应用领域内部署AI计算。
广发证券预测,DeepSeek采用的PTX平台为AI模型开发提供了“非CUDA”路线,以互联网为代表的AI计算下游厂商适配和采用国产化系统软件动力将大大增加。在DeepSeek带来的技术变革下,各厂商将加快探索除CUDA之外的其他计算平台。
端侧AI成本有望进一步降低
2月6日A股开盘,半导体板块涨幅居前,其中AIoT芯片公司股票涨幅显著。
AIoT芯片是在各种端侧处理AI计算的芯片。AI要进入各行各业,需要和各个行业场景中的设备相结合,这些设备需装有可处理AI计算的芯片。相比CPU和GPU芯片,作为端侧算力的AIoT芯片在处理速度、节能、AI计算优化等方面更有优势。而随着DeepSeeK的低成本和高性能的开源AI大模型被全球网络广泛议论,端侧AI推理成本有望进一步降低。在端侧AI应用需求增长的带动下,AIoT芯片公司有望迎来进一步的业绩增长。
中航证券研报认为,DeepSeek-R1说明了端侧AI部署变得更加具有普惠性,万物智能时代将加速到来。
根据此前披露的2024年度业绩预告,包括瑞芯微在内的多家AIoT芯片公司的业绩呈现爆发式增长。恒玄科技预计净利润增长264%~280%,乐鑫科技预计净利润增长120%~150%,全志科技预计增长566%~727%。
中航证券研报显示,瑞芯微的客户包括阿里巴巴、比亚迪、联想、小米、SONY等国内外客户,且多家客户已根据瑞芯微芯片,研发在端侧支持AI大模型的新硬件,包括教育平板、AI玩具、桌面机器人等。根据公司业绩预告,公司2024年的业绩表现在半导体板块较为突出,2024年预计实现营收31亿元~31.5亿元,创历史新高,实现净利润5.5亿元~6.3亿元,同比增长约307.75%~367.06%。
翱捷科技拥有多种无线通信技术,推出了蜂窝基带芯片、WiFi芯片、蓝牙芯片等,广泛应用于物联网领域。华信证券研报认为,翱捷科技掌握了超大规模数模混合IC、射频芯片、基带射频一体化集成技术及超低功耗的芯片设计技术。恒玄科技的芯片广泛应用于智能可穿戴和智能家居领域,光大证券(维权)研报显示,公司客户包括三星、小米、字节跳动、谷歌、海尔、格力等。
但也有业内人士对记者表示,AIoT芯片除了需要高效处理AI之外,还要考虑低功耗、低成本、可靠性等因素。
AI应用落地仍有挑战
DeepSeek引发的技术落地加速可能正在逐渐显现,国内二级市场中,多家上市公司发布与DeepSeek合作公告。
三六零公告,公司旗下部分产品进行了DeepSeek的接入与本地化部署。并行科技公告,公司智算云平台已部署智谱清言、DeepSeek-R1等主流模型。每日互动称已接入DeepSeek相关版本并完成评估,用于业务场景、研发提效等方面。奇安信已完成与DeepSeek的全面深度接入。
另外,万兴科技在投资者互动平台回复称,公司已完成推理大模型DeepSeek-R1的适配,并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。
万兴科技相关负责人对记者表示,推理大模型的成本优势表现为:通过算法和架构优化,减少计算资源消耗;提升硬件使用效率,降低单位计算成本;用更高效的数据处理方法减少数据预处理和存储开销;与现有产品深度集成,减少额外开发成本。
奇安信自研QAX安全大模型通过DeepSeek R1进行了一系列优化和蒸馏,降低运营成本,提升模型性能。目前QAX安全大模型已被引入到威胁研判、安全运营、渗透测试和漏洞管理、身份与访问管理、网络钓鱼防护、恶意软件和勒索软件防护、数据泄露防护等场景中。
奇安信集团安全专家对记者表示,蒸馏技术的优化能够将复杂的、大规模训练的模型知识转移到更小、更高效的模型中。
不过,天风证券研报分析认为,AI应用的普及及商业化还存在一定困难,尤其是在推理能力和多模态环节。整体来看,目前DeepSeek在性能和成本上取得显著突破,但模型在某些复杂任务上的表现仍需进一步优化,如在长文本生成、多模态任务、技术优化与稳定性,以及特定领域的推理能力上仍有提升空间。
刘知远表示,“我们需要警惕舆论一下从极度悲观转向了极度乐观,认为自身已经全面超越的观点,现实还远远没有。”
他认为,AGI新技术还在加速演进,未来发展路径还不明确,DeepSeek出圈的意义在于非常好地让人们看到中国AI的希望,但还未到胜券在握的地步。
(本文来自第一财经)