DeepSeek有望推动端侧AI成本降低，但AI应用落地仍具挑战

qweasjd 3小时前阅读数 3 #热点

　　2月6日，DeepSeek概念股继续上涨，截至发稿，Wind DeepSeek指数涨超5%，航锦科技（维权）、美格智能、浙江东方、每日互动、优刻得、杭钢股份、青云科技一字晋级，安凯微、天娱数科盘中分歧后同步涨停。A股多家上市公司发布已接入或正在对接DeepSeek模型。

　　此外，国产半导体板块涨幅居前。调研机构认为，在端侧AI应用需求增长的带动下，AIoT芯片公司有望迎来进一步的业绩增长。

　　中信证券发布研报称，DeepSeek V3及R1大模型以其低成本+高性能+开源等特点引发全球关注，通过模型层面创新，在芯片受限与低算力投入的背景下，达到全球顶尖闭源模型的性能水平，属于生态级突破，有望带动国内AI全产业快速发展，同时其开源与低成本特性也有望赋能AI应用厂商，加速推动端侧AI落地。

（图片来源网络，侵删）

　　重塑AI生态

　　DeepSeek通过重塑开源大模型生态，吸引了更多开发者和企业参与到开源大模型的建设和应用中。

　　一方面，DeepSeek通过采用MIT许可协议（麻省理工学院许可证，一种宽松的开源软件许可证），支持免费商用、任意修改和衍生开发。Meta 首席AI科学家Yann LeCun表示，DeepSeek的成功得益于开放生态，创新基于前人成果的持续迭代，显示出开源模型正在超越闭源系统。

（图片来源网络，侵删）

　　为了追赶生态建设，谷歌DeepMind CEO Demis Hassabis在谷歌发布2.0系列产品后发文表示：通过不断提高质量与降低成本，（团队）取得了令人兴奋的进展。2.0系列是成本与性能方面的领先模型，所有人都可以使用Gemini 2.0强大的推理能力和多模态功能，这也为谷歌未来的自主智能体研究奠定了基础。

　　360集团创始人、董事长周鸿祎今日表示，DeepSeek刺激了全球其他开源团队，大家你追我赶。同时在DeepSeek公开的技术原理上产生新的思考。

　　另在性价比方面，面壁智能联合创始人兼首席科学家刘知远表示，DeepSeek V3的重要启示在于，它展示了如何用1/10甚至更少的成本达到GPT-4和GPT-4o水平。原因上，DeepSeek V3在底层算力加速方面做了大量工作，实现算法和底层软硬件的协同优化。这种一体化优化机制让行业看到，即使成本已很低，仍可通过优化进一步降低成本。“虽然V3的成本仍是几百万美元甚至几千万美元，但相比国际公认水平已经低得多，这也是英伟达股价下降的一个重要原因。”刘知远表示。

（图片来源网络，侵删）

　　DeepSeek的生态繁荣除了上述要素，还包括开发者工具与平台、提供高性能计算与硬件支持的计算平台。绕过英伟达并行计算平台和编程模型CUDA，DeepSeek团队部署了定制化PTX（Parallel Thread Execution）平台，提升硬件适配灵活性，加速训练任务，同时可以优化其他GPU平台，如1月25日，AMD宣布将DeepSeek V3集成到其MI300X GPU中；2月1日，硅基流动与华为云联合推出基于昇腾云的DeepSeek-R1&V3推理服务，可获得持平全球高端GPU部署模型的效果；2月2日，DeepSeek两款模型完成海光DCU适配并上线，国产芯片与DeepSeek系列模型实现无缝衔接。

　　AMD董事长兼CEO苏姿丰此前表示，DeepSeek使行业出现用更少基础设施来实现训练和推理能力的新方法，这是件好事，这也使AMD能够继续在更广泛的应用领域内部署AI计算。

　　广发证券预测，DeepSeek采用的PTX平台为AI模型开发提供了“非CUDA”路线，以互联网为代表的AI计算下游厂商适配和采用国产化系统软件动力将大大增加。在DeepSeek带来的技术变革下，各厂商将加快探索除CUDA之外的其他计算平台。

　　端侧AI成本有望进一步降低

　　2月6日A股开盘，半导体板块涨幅居前，其中AIoT芯片公司股票涨幅显著。

　　AIoT芯片是在各种端侧处理AI计算的芯片。AI要进入各行各业，需要和各个行业场景中的设备相结合，这些设备需装有可处理AI计算的芯片。相比CPU和GPU芯片，作为端侧算力的AIoT芯片在处理速度、节能、AI计算优化等方面更有优势。而随着DeepSeeK的低成本和高性能的开源AI大模型被全球网络广泛议论，端侧AI推理成本有望进一步降低。在端侧AI应用需求增长的带动下，AIoT芯片公司有望迎来进一步的业绩增长。

　　中航证券研报认为，DeepSeek-R1说明了端侧AI部署变得更加具有普惠性，万物智能时代将加速到来。

　　根据此前披露的2024 年度业绩预告，包括瑞芯微在内的多家AIoT芯片公司的业绩呈现爆发式增长。恒玄科技预计净利润增长264%~280%，乐鑫科技预计净利润增长120%~150%，全志科技预计增长566%~727%。

　　中航证券研报显示，瑞芯微的客户包括阿里巴巴、比亚迪、联想、小米、SONY等国内外客户，且多家客户已根据瑞芯微芯片，研发在端侧支持AI大模型的新硬件，包括教育平板、AI玩具、桌面机器人等。根据公司业绩预告，公司2024年的业绩表现在半导体板块较为突出，2024年预计实现营收31亿元~31.5亿元，创历史新高，实现净利润5.5亿元~6.3亿元，同比增长约307.75%~367.06%。

　　翱捷科技拥有多种无线通信技术，推出了蜂窝基带芯片、WiFi芯片、蓝牙芯片等，广泛应用于物联网领域。华信证券研报认为，翱捷科技掌握了超大规模数模混合IC、射频芯片、基带射频一体化集成技术及超低功耗的芯片设计技术。恒玄科技的芯片广泛应用于智能可穿戴和智能家居领域，光大证券（维权）研报显示，公司客户包括三星、小米、字节跳动、谷歌、海尔、格力等。

　　但也有业内人士对记者表示，AIoT芯片除了需要高效处理AI之外，还要考虑低功耗、低成本、可靠性等因素。

　　AI应用落地仍有挑战

　　DeepSeek引发的技术落地加速可能正在逐渐显现，国内二级市场中，多家上市公司发布与DeepSeek合作公告。

　　三六零公告，公司旗下部分产品进行了DeepSeek的接入与本地化部署。并行科技公告，公司智算云平台已部署智谱清言、DeepSeek-R1等主流模型。每日互动称已接入DeepSeek相关版本并完成评估，用于业务场景、研发提效等方面。奇安信已完成与DeepSeek的全面深度接入。

　　另外，万兴科技在投资者互动平台回复称，公司已完成推理大模型DeepSeek-R1的适配，并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。

　　万兴科技相关负责人对记者表示，推理大模型的成本优势表现为：通过算法和架构优化，减少计算资源消耗；提升硬件使用效率，降低单位计算成本；用更高效的数据处理方法减少数据预处理和存储开销；与现有产品深度集成，减少额外开发成本。

　　奇安信自研QAX安全大模型通过DeepSeek R1进行了一系列优化和蒸馏，降低运营成本，提升模型性能。目前QAX安全大模型已被引入到威胁研判、安全运营、渗透测试和漏洞管理、身份与访问管理、网络钓鱼防护、恶意软件和勒索软件防护、数据泄露防护等场景中。

　　奇安信集团安全专家对记者表示，蒸馏技术的优化能够将复杂的、大规模训练的模型知识转移到更小、更高效的模型中。

　　不过，天风证券研报分析认为，AI应用的普及及商业化还存在一定困难，尤其是在推理能力和多模态环节。整体来看，目前DeepSeek在性能和成本上取得显著突破，但模型在某些复杂任务上的表现仍需进一步优化，如在长文本生成、多模态任务、技术优化与稳定性，以及特定领域的推理能力上仍有提升空间。

　　刘知远表示，“我们需要警惕舆论一下从极度悲观转向了极度乐观，认为自身已经全面超越的观点，现实还远远没有。”

　　他认为，AGI新技术还在加速演进，未来发展路径还不明确，DeepSeek出圈的意义在于非常好地让人们看到中国AI的希望，但还未到胜券在握的地步。

　　（本文来自第一财经）

上一篇：美国邮政局“朝令夕改”，让美国供应链相关行业和航运业措手不及下一篇：商务部：中方对于单边霸凌举措一定会采取必要措施