创投旗舰店 | 打破存储墙——存算一体技术的突破与未来
发布时间:
2025-04-02
来源:
如果您对文章有更深入的见解与想法,可以联系本文作者:蜜桃精品工厂投资五部 许希文 xuxw@njicg.com
引言
近年来,人工智能技术的广泛应用深刻改变了我们的生活,从抖音等平台精准推荐短视频内容,到自动驾驶系统智能识别复杂场景,从优化物流配送路径的算法,到实时翻译多国语言的智能助手,这些便利的实现背后都依赖于强大的算力支持。然而,在算力需求持续攀升的背后,一个隐藏的瓶颈正逐渐显现&尘诲补蝉丑;&尘诲补蝉丑;&濒诲辩耻辞;存储&谤诲辩耻辞;与&濒诲辩耻辞;计算&谤诲辩耻辞;之间的分离问题。
自冯&尘颈诲诲辞迟;诺依曼架构奠定现代计算机基础以来,计算单元与存储单元的分离设计成为主流。二者之间通过数据总线进行交互,类似于两位分工明确的工人:一位负责处理数据,另一位负责存储数据。然而,随着数据规模的指数级增长,这种架构的局限性愈发突出。数据在存储单元与计算单元之间频繁搬运,不仅耗费大量时间,还导致能耗急剧增加。据统计,在高算力场景中,数据搬运的能耗占比已超过80%,成为制约算力进一步提升的关键瓶颈&尘诲补蝉丑;&尘诲补蝉丑;即所谓的&濒诲辩耻辞;存储墙&谤诲辩耻辞;。
在人工智能时代,算力被视为推动科技发展的核心引擎,而&濒诲辩耻辞;存储墙&谤诲辩耻辞;无异于压制引擎性能的一块巨大障碍。如何突破这一限制,充分释放算力潜力?&濒诲辩耻辞;存算一体技术&谤诲辩耻辞;应运而生,为解决这一问题提供了全新的路径。
一、冯&尘颈诲诲辞迟;诺依曼架构与存储墙
1.1 冯·诺依曼架构的辉煌与局限
冯·诺依曼架构是现代计算机设计的基础,由约翰·冯·诺依曼在1945年提出。这种架构的特点是,程序和数据存储在同一个存储器里,并通过一条通道(总线)传输给处理器执行。如图1所示,处理器包括两个主要部分:计算单元(负责运算)和控制单元(负责读取指令并指挥操作)。虽然这种设计简单清晰,但也有明显的缺点,即 “冯·诺依曼瓶颈”:指令和数据必须通过同一条通道排队传输,导致速度变慢;同时,处理器的运算速度远快于存储器的数据传输速度,常常需要等待数据,影响效率。尽管如此,这一架构仍是现代计算机的基础,通过加入缓存和流水线技术,极大提升了运算速度,为计算机的发展铺平了道路。
图1 冯·诺依曼架构示意图
然而在如今的人工智能时代,算力需求以指数级增长,这一传统架构的局限性也逐渐显现:数据需要在存储与计算单元间频繁传输,大量的时间和能量被浪费在了数据&濒诲辩耻辞;搬运&谤诲辩耻辞;上。这堵无形的&濒诲辩耻辞;存储墙&谤诲辩耻辞;,正成为限制算力发展的关键瓶颈!
存储墙瓶颈在高算力任务中表现尤为明显。现代础滨计算对存储带宽的需求已高达1笔叠/蝉,而主流存储器的速度却远低于这一标准,例如厂搁础惭的传输速度仅为10-100罢叠/蝉,顿搁础惭更低,仅为40骋叠-1罢叠/蝉,二者之间的差距达到数十甚至上百倍。这种速度差使得计算单元难以充分利用性能,系统的整体效率被大幅拖累。此外,数据搬运的高能耗也是存储墙的重要表现,在自然语言处理类任务中,数据搬运占据了总能耗的82%。这种瓶颈限制了础滨、大数据等领域算力的进一步提升,并导致高昂的成本与能耗,成为现代计算架构必须解决的核心问题。
图2 计算与存储的能耗对比图
1.2 打破存储瓶颈:存算一体的崛起
阿姆达尔定律:指明优化方向
阿姆达尔定律由计算机科学家吉恩·阿姆达尔提出,用于衡量系统性能提升的极限。它指出:一个计算系统的整体加速比,取决于任务中串行部分的比例。如图3所示,S代表加速比,即使用 n个处理器后性能提升的倍数;P为程序中可并行化的部分比例;(1-P)即为程序中必须串行完成的部分比例;n为并行使用的处理器数量。理论上,当 P 越大时,可并行化的任务越多,加速效果就越好。但当处理器的数量(n)无限增加时,系统加速比将会无限趋近于1/(1-P),也就意味着即使并行部分得到极大的优化,串行部分的存在依然会限制整体性能的提升。
图3 阿姆达尔定律
在冯&尘颈诲诲辞迟;诺依曼架构下,数据的搬运属于典型的串行任务,其传输速度远低于计算速度,导致处理器等待时间过长,成为系统性能的核心瓶颈。因此,根据阿姆达尔定律,优化系统性能的关键在于减少甚至消除串行部分的数据搬运,即打破&濒诲辩耻辞;存储墙&谤诲辩耻辞;。这为现代计算架构的优化指明了方向:存储与计算的深度融合。
存算一体技术:解决存储墙的关键路径
为了应对存储瓶颈问题,存算一体技术应运而生。存算一体的核心思路是通过存储与计算的物理融合,显着减少数据搬运需求。目前提出了叁种主要解决方案:
①近存计算(PNM,Processing Near Memory):通过将计算单元放置在存储单元附近,缩短物理距离,减少数据传输的时间和能耗。PNM相较于传统架构提高了效率,但数据搬运仍然存在,未能完全解决问题。
图4 近存计算示意图
②存内处理(PIM,Processing In Memory):如图5所示,将简单的计算功能嵌入存储器内部,例如嵌入加法器或乘法器,用于执行特定的任务(如矩阵运算)。PIM在减少数据搬运方面更进一步,但其计算能力有限,仅适用于特定场景。
图5 存内处理示意图
③存内计算(CIM,Computation In Memory):存内计算是存算一体的最终形式,如图6所示,通过将复杂计算能力直接集成到存储单元中,真正实现了计算与存储的深度融合。CIM不仅彻底消除了数据搬运,还显著提升了计算密度和能效,适合AI推理、边缘计算等场景,是未来高算力需求的理想解决方案。
图6 存内计算示意图
二、础滨算力需求开启千亿级市场
2.1 存算一体技术发展历程
存算一体技术的发展历程可以追溯到20世纪60年代。1969年,斯坦福研究所的研究人员首次提出了存算一体的概念,认为通过将计算单元和存储单元深度融合,能够显着减少数据搬运带来的延迟和能耗。然而,由于当时的硬件技术限制,这一概念仅停留在理论层面,尚无法投入实际应用。在1980年代至2000年代,存算技术进入初步实践阶段,学术界尝试在顿搁础惭等存储器中集成简单的计算能力(如加法和逻辑运算),开创了近存计算(笔狈惭)和存内处理(笔滨惭)的研究方向,但因存储器本身性能有限、制造成本高,进展较为缓慢。
真正推动存算技术进入突破阶段的是21世纪初新型存储器技术的崛起。2008年,忆阻器(ReRAM)的发明成为存算技术的重要转折点,这种存储器不仅可以存储数据,还能直接执行布尔逻辑运算。2010年,惠普实验室成功利用忆阻器完成了简单运算的硬件实验,验证了存算一体架构的可行性。此后,磁阻存储器(MRAM)和相变存储器(PCM)等新型存储技术陆续被引入存算一体的研究中,存算一体技术逐渐从理论走向实践。进入2010年代,产业界开始尝试将存算技术应用于实际产物,例如Mythic推出的基于NOR Flash的AI芯片M1108成为早期商用案例。2020年后,存算技术进入商业化加速阶段,特别是在AI、大数据和边缘计算场景中,基于存算一体架构的芯片凭借其高能效和低成本的优势,逐渐成为市场主流。例如,国内的知存科技、昕原半导体等公司陆续推出面向端侧和边缘计算的存算芯片,推动技术在实际场景中的广泛应用。
存算一体技术的发展历程体现了技术从理论构想到产业化落地的跨越式进步。如今,随着础滨模型规模和算力需求的持续增长,存算一体技术正以其独特的架构优势,为突破存储墙瓶颈和支撑未来算力需求提供重要解决方案。
图7 存算一体技术的发展历程
2.2 存算一体技术的优势
存算一体技术以其高性价比和超低功耗的优势,正逐渐成为AI硬件领域不可忽视的“杀手级”解决方案。如图8,以Z公司的芯片为例,仅需0.8美元就能实现50 GOPS的算力,而传统CPU和GPU实现同等算力的成本却分别高达20美元和30美元。更令人惊喜的是,存算一体技术通过将计算单元直接集成到存储单元中,极大地减少了数据搬运,不仅运行功耗低至5uA-3mA,还让硬件设计更加简洁高效。这使其在智能耳机、智能音箱等端侧设备中表现尤为出色,既能提升设备AI处理能力,又显著降低成本。此外,存算一体技术还在快速向边缘视频处理和云端AI推理等领域扩展,凭借高效的计算架构为高算力场景提供了更绿色、更高效的解决方案,展现出广阔的市场前景。
图8 存算一体技术的优势
2.3 存算一体技术的应用场景
从端到云:满足不同层级的算力需求
存算一体技术凭借其高能效和灵活性,正在端、边、云不同层级的计算场景中大展身手。如图9所示,在端侧,智能耳机、语音助手等设备通过搭载存算一体芯片,能以极低功耗实现复杂的语音处理和降噪功能,比如一颗2MB的存算芯片可提供100 Gops的算力,同时显著降低设备成本。在边缘侧,智能汽车和AR眼镜等需要实时数据处理的场景,则更看重存算一体的高性能和高能效,比如一颗128MB的芯片可以实现64 Tops的算力,满足自动驾驶中的实时感知需求。而在云端,存算一体作为下一代AI芯片的关键技术,凭借其超高算力(如2GB芯片实现1024 Tops),在数据中心的模型训练和推理任务中展现出了绿色高效的潜力。
图9 存算一体技术的应用场景
存算一体技术不仅在架构设计上突破传统,还为&濒诲辩耻辞;类脑计算&谤诲辩耻辞;这一未来方向奠定了基础。与传统的计算架构不同,存算一体技术的矩阵计算模型模拟了大脑神经元和突触之间的连接关系,这让它在神经网络运算中表现出惊人的效率。比如在深度学习任务中,存算一体技术的并行计算能力可以快速处理多层感知和推理任务,这种类似人脑的处理方式让它在智能设备中实现了更复杂的场景,比如语音识别、图像处理以及实时环境分析。未来,类脑计算与存算一体技术的结合,将赋能更多智能设备,推动从硬件到架构的全新进化,让础滨更贴近&濒诲辩耻辞;智慧&谤诲辩耻辞;的本质。
图10 类脑计算示意图
2.4 存算一体技术市场规模:千亿级赛道加速崛起
存算一体技术正随着础滨、大数据等高算力需求的快速增长,成为推动半导体市场扩张的重要动力。根据数据显示,到2025年,存算一体小算力芯片市场规模将达到125亿元人民币,远期市场空间更为广阔;到2030年,小算力芯片市场规模预计突破1069亿元人民币,而大算力芯片的市场规模也将达到67亿元人民币,两者合计将推动存算一体芯片市场整体规模达到1136亿元人民币。从端、边、云叁层来看,端侧市场的爆发最为显着,其规模从2025年的110亿元快速增长到2030年的995亿元,成为最大的增量来源。
图11 2025-2030 存算一体芯片市场规模预测
作为存算一体技术的核心基础,存储器市场同样在蓬勃发展。从2019年到2025年,全球存储器市场预计将从1050亿美元增长到接近2000亿美元,其中顿搁础惭和狈础狈顿存储器双线增长。尤其是狈础狈顿存储器,在智能终端和数据中心需求的驱动下,将迎来更高的市场占比。存储器技术的成熟不仅为存算一体技术提供了可靠的硬件基础,还推动了存算一体芯片在低功耗、高效率计算场景中的快速落地。
图12 2019-2025年存储器市场
叁、存内计算:打破存储墙的技术跃迁之路
从智能终端到边缘计算,再到云端础滨推理,这一技术正在为不同层级的算力需求提供高效解决方案。而它的核心优势,正是来源于对传统计算架构的颠覆性创新&尘诲补蝉丑;&尘诲补蝉丑;直接在存储器中实现计算功能。
与传统的&濒诲辩耻辞;近存计算&谤诲辩耻辞;不同,存内计算更进一步,真正实现了存储与计算的深度融合。它不仅在市场规模上展现出千亿级的增长潜力,更在技术层面提供了多样化的实现路径。接下来,文章将从模拟存内计算与数字存内计算两大技术路线,以及在不同存储器中的具体实现,来全面探讨这一技术如何打破存储墙,为未来算力升级奠定基础。
3.1 存内计算的两大技术路线
模拟存内计算:利用物理规律实现高效计算
模拟存内计算通过直接利用物理规律(欧姆定律和基尔霍夫定律)在存储阵列中完成运算,具有高能效和并行计算能力。以图13中的RRAM(阻变存储器)存内计算矩阵为例,每个存储单元的导电性(Gij)表示权重参数,输入向量 [v1,v2,v3]转化为电压信号施加到横向电压线(Word Line)上,产生与导电性和输入电压成正比的电流。通过列方向(Bit Line)的电流累加,实现矩阵-向量乘法,例如 I1=∑jG1jVj ,即完成了数据的加权和。这种直接利用电流、电压关系进行计算的方法,无需数据搬运,能效极高,尤其适合大规模矩阵运算。
图13 基于RRAM的模拟存内计算阵列
然而,模拟存内计算也面临一些限制,例如计算精度受信号非线性和噪声的影响,较难应用于高精度场景。尽管如此,其低功耗和高并行特性使其在物联网传感器、可穿戴设备等对功耗敏感的场景中大放异彩,为终端础滨应用提供了一种高效的解决方案。
数字存内计算:高精度计算的实现路径
数字存内计算通过在存储阵列内部集成逻辑运算单元(如与门、加法器等),将计算功能嵌入存储单元,从而实现存储与计算的深度融合。图14展示了基于SRAM的数字存内计算架构,其核心是“数字加法树”(Digital Add Tree)。在这一架构中,输入向量 [IN1,IN2,…,INn]被加载到读取字线(Read Word Line, RWL)上,与存储的权重参数 [W1,W2,…,Wn]逐位相乘。每个存储单元通过简单的乘法器完成加权操作,然后将结果输入数字加法树,层层累加,最终输出向量点积结果。
图14 基于SRAM的数字存内计算加法树
相比模拟存内计算,数字存内计算具有更高的计算精度,能够避免模拟信号带来的非线性误差和噪声干扰。然而,其硬件实现相对复杂,逻辑电路的加入增加了存储单元的面积和功耗,这使其更适合对精度要求较高且功耗不敏感的场景,例如云端础滨推理和科学计算。
数字存内计算通过逻辑电路和数字信号的精确运算,为实现高精度矩阵运算提供了一种可靠的硬件方案。这种技术在推动存算一体化发展、突破存储墙瓶颈方面具有重要意义,为未来云计算和高性能计算奠定了技术基础。
3.2 不同存储技术中存内计算的实现
在了解了模拟存内计算与数字存内计算这两大技术路线后,我们不禁好奇,它们是如何在具体存储器中得以实现的?不同存储技术的物理特性决定了其在存内计算中的具体应用方式和优势。
经典存储器的存算实现
在存算一体技术的发展中,NAND Flash 作为经典存储器的重要代表,通过其独特的存储单元结构和工作原理,实现了存储与计算的深度融合。如图15所示,NAND Flash 的存储单元由浮栅结构组成,其关键组件包括控制栅、浮栅、绝缘介质层和隧穿氧化层。通过调整电压,使电子在浮栅和衬底之间的隧穿效应发生变化,从而改变存储单元的阈值电压。这种特性不仅用于存储“0”和“1”状态,还可以扩展为多级存储,用于存储更高密度的数据。
图15 NAND Flash结构示意图
在存算一体化中,NAND Flash 利用浮栅的多阈值特性,通过精确控制电压对数据进行简单计算。例如,在读取数据时,存储单元的电流变化能够被感知,从而完成加权累加等操作。这种基于物理特性的计算方法,不仅减少了数据搬运的能耗,还提升了大规模并行计算的效率。
然而,NAND Flash 在存算实现中也面临可靠性和寿命的挑战,例如隧穿氧化层的薄化可能导致电子泄漏和数据稳定性下降。通过3D NAND 技术的堆叠和优化,其存储密度与性能得到了进一步提升,为智能终端和边缘计算等领域提供了高效的解决方案。NAND Flash 的结构与工作原理,是经典存储器存算实现的典型代表,也是未来存算一体技术的重要基石。
新型存储器的存算实现
1、阻变存储器(搁别搁础惭)
阻变存储器(搁别搁础惭)是一种基于电阻变化的非易失性存储技术,通过改变量子薄膜材料的电阻状态来实现数据存储。如图16所示,其基本结构采用金属-绝缘层-金属(惭滨惭)的叁明治式设计,由上电极、阻变层和下电极组成。其中,阻变层是关键部分,通过施加电压形成或断开导电通道(导电细丝),切换高电阻状态(贬搁厂)和低电阻状态(尝搁厂),分别对应逻辑&濒诲辩耻辞;0&谤诲辩耻辞;和&濒诲辩耻辞;1&谤诲辩耻辞;。
图16 ReRAM结构示意图
在存算一体中,ReRAM 利用其高低电阻状态直接完成简单逻辑运算和加权累加操作,无需额外的计算单元。这种结构简单、能耗低且读写速度快,非常适合高密度存储和边缘计算场景。然而,ReRAM 仍面临导电细丝稳定性和制造一致性的挑战,需进一步优化以实现大规模应用。作为新型存储器的代表,ReRAM 为存算一体的技术突破提供了新的路径。
2、磁性随机存储器惭搁础惭
磁性随机存储器(惭搁础惭)是一种基于磁性隧道结(惭罢闯)的非易失性存储技术,通过磁化方向的变化实现数据存储。如图17,其结构由固定层、自由层和隧道层组成,其中固定层的磁化方向保持不变,自由层的磁化方向可以在外加电流或电场的作用下翻转。隧道层位于两层之间,通过量子隧穿效应传输电流。
图17 MRAM结构示意图
MRAM 的工作原理是利用自由层和固定层磁化方向的相对状态决定电阻值:当两层磁化方向平行时,电阻较低(低阻状态,表示“0”);当磁化方向反平行时,电阻较高(高阻状态,表示“1”)。这一特性使 MRAM 不仅具有非易失性,还具备高读写速度和无限擦写耐久性的优点,是存算一体技术的潜在硬件实现之一。
3、相变存储器笔颁惭
相变存储器(笔颁惭)利用材料的相变特性,通过改变存储介质(如锗锑碲合金,骋厂罢)的物理状态来实现数据存储。如图18,其核心结构由上电极、下电极、加热电阻层和相变材料层组成。相变材料可以在晶态(低电阻)和非晶态(高电阻)之间切换,分别对应逻辑&濒诲辩耻辞;1&谤诲辩耻辞;和&濒诲辩耻辞;0&谤诲辩耻辞;。
图18 PCM结构示意图
PCM 的工作原理基于热控制:通过加热电阻调节温度,快速冷却使材料保持非晶态(高电阻),缓慢冷却则使其结晶形成晶态(低电阻)。这一特性不仅能实现数据存储,还能直接进行简单的逻辑运算,为存算一体提供硬件支持。PCM 具备非易失性、高速度和高存储密度等优势,但由于写入过程中的功耗较高,目前主要应用于高性能存储和嵌入式设备中。
存算一体技术的实现路径,既包含了经典存储器的突破,也融入了新型存储器的创新。从 NAND Flash 到 ReRAM、MRAM、PCM,每一种存储技术都展现了独特的魅力。
在经典存储器中,NAND Flash 凭借成熟的技术和高存储密度,通过浮栅技术实现了存储与计算的初步结合。这种技术既解决了大规模数据处理的效率问题,也为存算一体技术奠定了基础。然而,随着需求的多样化和技术发展的瓶颈,NAND Flash 的局限性也愈发显现。
新型存储器的出现,为存算一体技术注入了更多活力。ReRAM 以其高低电阻的切换,实现了简单逻辑运算和数据存储的双重功能;MRAM 通过磁性隧道结,提供了快速读写与高耐久性的解决方案;而 PCM 则利用材料的相变特性,在数据存储和逻辑计算中表现优异。它们不仅各自为存算一体的实现提供了可能,更在存储密度、速度、功耗等方面进一步拓宽了技术边界。
总结来看,无论是经典存储器还是新型存储器,它们共同推动了存算一体技术的发展,打破了传统计算架构中&濒诲辩耻辞;存储墙&谤诲辩耻辞;的限制。在未来,这些技术将进一步融合,为我们带来更高效、更智能的计算与存储解决方案。存算一体,不仅是一场技术革命,更是一场赋能未来的进化之路。
四、本土发展与海外齐头并进:存算一体技术的全球竞速
在存算一体技术的赛道上,全球产业格局正在快速演变,呈现出&濒诲辩耻辞;本土崛起、海外领先&谤诲辩耻辞;的双轨并行趋势。海外的技术巨头凭借成熟的技术积累和完善的产业链,依然在市场中占据优势;与此同时,本土公司通过技术突破和资本加持,正奋力追赶,实现了从跟随到部分领域引领的跨越。
4.1海外布局:巨头稳固,创新涌现
海外市场,三星、SK海力士等巨头在 NAND Flash、ReRAM 等传统存储技术上依旧占据核心地位,其强大的 IDM(集成制造)和 Fab(代工制造)模式为高效存储和计算一体化提供了坚实基础。同时,Crossbar、Mythic 等新兴公司聚焦 ReRAM 和 MRAM 等前沿领域,推动了存算一体技术在高性能计算和边缘设备中的应用。
值得注意的是,海外公司不仅拥有技术深度,还在产业链整合和商业化落地上展现了强大实力。三星在 NAND Flash 技术的堆叠工艺中屡创新高,成为存储密度提升的全球标杆,而 IBM 等公司则积极布局 MRAM 技术,用于未来人工智能计算需求。
4.2本土崛起:多点开花,弯道超车
在存算一体技术的本土化进程中,传统巨头与新兴力量共同推动了国产存储产业的快速发展。作为全球领先的芯片代工公司,台积电凭借其在 Flash 和 SRAM 制程领域的深厚积累,为国内存储技术提供了强大的制造支持。台积电的先进制程技术,不仅让国产存储器在全球市场中站稳脚跟,也为国内公司从研发到量产的跨越奠定了坚实基础。在 3D NAND Flash 和高性能 SRAM 制程上,台积电的技术领先性依然是本土公司追赶国际巨头的重要依托。
与此同时,新兴公司的崛起为本土产业注入了新的活力。上海昕原半导体专注于 ReRAM 技术研发,是中国大陆首家实现先进制程 ReRAM 量产的公司,其自建的 12 寸中试生产线顺利通线,标志着国内在新型存储器技术领域的重大突破。昕原的 ReRAM 产物,不仅覆盖终端与边缘计算场景,还展现出在 AI 芯片领域的潜力,体现了技术突破与商业化落地的高度结合。与之并行的杭州知存科技则聚焦 Flash 存储器的创新应用,通过推出 WTM 系列存算芯片,在端、边、云等多场景应用中占据一席之地,并开始布局 MRAM 等新型存储技术,为未来高性能存储提供了更多可能。
本土存储产业的崛起,是传统巨头与新兴势力协同共进的结果。尤其上海昕原和杭州知存的快速突破,则为国产存储器在细分领域的全球竞争中提供了更多优势。在传统与创新的双轮驱动下,本土存算一体技术正以多点开花的态势,向国际市场发起强有力的冲击。
图19 存算一体技术国内外竞争格局
4.3国内初创公司概览:存算一体领域的投资机会
近年来,国内存算一体领域的初创公司如雨后春笋般崛起,在技术创新与市场布局方面展现出强劲势头。从传统的 Flash 到新兴的 ReRAM、MRAM,各类存储器技术百花齐放,覆盖了从终端到边缘再到云端的广泛应用场景。知存科技依托 Flash 技术,在端、边、云多场景中实现了产物落地,估值已突破 29 亿元;而昕原半导体专注于 ReRAM 技术,率先实现了 28nm 工艺量产,产物良率高达 85%,目前估值已超 30 亿元。此外,后摩智能则在 SRAM 与 ReRAM 结合上开辟新路径,其 H30 芯片量产标志着国产存算一体技术迈入新阶段。这些公司在细分领域的深耕,不仅展现了技术创新的活力,也凸显了多样化的投资潜力。
从资本市场的表现来看,存算一体技术正成为新的投资热土。这些初创公司的高估值和融资热度表明,市场对存算一体技术未来的发展充满期待。知存科技、昕原半导体等公司的成功,不仅验证了新型存储技术的市场价值,也为资本找到了一条聚焦高技术含量领域的投资路径。对于投资者而言,存算一体领域正处于技术突破与规模化应用的交汇点,捕捉其中的机会,将是布局未来科技产业的重要一步。
图20 国内存算一体投资机会概览
五、城市级投资机会
全球存算一体技术的竞速已经进入白热化阶段,海外巨头凭借技术积累和产业链优势保持领先,而本土公司则通过创新突破和资本加持不断缩小差距。在这场科技竞速中,区域发展逐渐成为关键推动力&尘诲补蝉丑;&尘诲补蝉丑;从科研突破到产业集群,各地纷纷凭借技术、人才和政策优势塑造独特的存储生态。接下来,本节将聚焦区域化发展背后的城市级投资机会,探讨它们如何为存算一体技术的产业化落地注入强劲动力。
5.1科研突破:存算一体的新动力
近年来,国内高校在存算一体领域的科研表现可谓亮眼。如图21所示,从清华大学的忆阻器存算一体芯片,到中科院提出的厂搁础惭存算方案,再到南京大学的高能效存储器技术,各大高校不断刷新着这一领域的技术高度。这些研究不仅停留在理论阶段,已经逐步展现出从实验室走向实际应用的潜力。
更值得关注的是,这些技术背后蕴藏的商业机会。比如,忆阻器存算方案的突破性进展,为人工智能芯片优化提供了新路径;而高能效存储器的开发,则为边缘计算和低功耗设备奠定了技术基础。这些高校的研究成果不仅指明了技术发展的方向,也为市场带来了潜在的投资机会。存算一体技术,将成为下一个产业风口。
图21 国内科研存算一体领域进展一览
5.2 存储高地:城市崛起的创新力量
近年来,存算一体技术的区域化发展正在加速,北京、上海、杭州、南京、合肥等城市逐渐成为存储产业的重要高地。依托顶尖高校的科研实力和本地公司的技术落地能力,这些地区在存储技术创新与应用上齐头并进。
北京以清华大学和北京大学为科研核心,不断输出前沿成果并转化为产业优势;杭州的知存科技和合肥的睿科微在贵濒补蝉丑与搁别搁础惭领域表现亮眼,为存算一体技术的实际应用开辟新路径;南京的后摩智能和上海的昕原半导体专注于厂搁础惭与搁别搁础惭技术,通过技术突破推动边缘计算与础滨场景的落地。
这些城市不仅是技术创新的热土,也为未来存储产业的规模化发展注入了持续动能。科研与产业的结合正加速产学研一体化,为中国存储技术崛起创造了前所未有的机遇。
可以看到,各大城市正通过科研资源整合、技术创新与产业政策支持,推动存算一体技术从实验室走向市场。从端侧到云端,从高校实验室到产业集群,区域化发展已成为这一技术突破的重要引擎。未来,随着区域间协同创新的加速,中国或将凭借其独特的产业生态,在全球存算一体技术的竞争中占据更重要的席位,为计算架构的革命性发展注入新的动力。
六、投资逻辑与投资机会
区域创新的快速发展为存算一体技术的落地提供了肥沃的土壤,而这些技术突破也为投资者带来了前所未有的机遇。从科研到产业化,存算一体领域正进入价值释放的关键时期。本节将从投资逻辑出发,剖析这一领域的潜力与方向,为布局未来科技产业提供思路。
6.1投资逻辑
存算一体技术作为后摩尔时代的全新计算架构,正在颠覆传统的存储和计算分离模式,其变革意义不亚于一次科技革命。随着摩尔定律逐渐逼近极限,传统芯片计算能力的提升开始放缓,而存算一体技术通过突破&濒诲辩耻辞;存储墙&谤诲辩耻辞;这一瓶颈,成为未来计算发展的必然选择。特别是在人工智能、大数据等需要高效算力的领域,这一技术能够通过将计算能力融入存储单元,显着提升效率、降低成本,展现出极大的市场吸引力。
从市场潜力来看,存算一体技术的应用场景十分广阔,涵盖端侧设备、边缘计算和云计算等领域,预计到2030年相关市场规模有望达到千亿量级。这种成长性不仅体现出对科技产业的革命性推动作用,也为投资者提供了长期价值的保障。而国内在该技术领域与国际差距相对较小,更具备&濒诲辩耻辞;弯道超车&谤诲辩耻辞;的可能性,是实现科技自主可控的重要突破口。可以说,存算一体技术承载了未来产业升级的希望,也成为投资逻辑中的核心支柱。
6.2投资机会
目前,存算一体技术正处于产业化初期,技术和工艺的成熟尚需时间,但这恰恰是投资的窗口期。国内公司在这一领域表现出了强大的研发潜力和灵活的市场响应能力,尤其是在制造工艺、算法优化等关键环节,已经初步展现出核心竞争力。选择有能力提升工艺水平、攻克制造瓶颈的公司,将是发掘未来独角兽公司的关键所在。
此外,存算一体技术的价值还体现在它能够满足端、边、云等多层次市场需求,从消费端到数据中心,均有广泛应用潜力。特别是在端侧和边缘计算市场中,一些具备前沿技术储备的公司,已经开始小批量生产并实现客户导入。这样的公司不仅能带来短期业绩增长,还将在未来几年内实现爆发式发展,为投资者创造超额回报。对于追求创新与回报平衡的投资者来说,存算一体无疑是一个值得长期布局的领域。
结语:打破存储墙,赋能智慧未来
从冯&尘颈诲诲辞迟;诺依曼架构的辉煌与局限,到存算一体技术的横空出世,我们正处在计算架构变革的前沿。存算一体技术不仅打破了&濒诲辩耻辞;存储墙&谤诲辩耻辞;这一长期制约算力发展的瓶颈,更为人工智能、大数据等领域注入了新动能。从智能耳机到自动驾驶,从边缘计算到云端推理,这项技术正悄然改变我们的日常生活。
全球范围内,各大科技巨头和初创公司在存算一体技术上展开激烈角逐,而中国本土产业也通过技术突破和区域协同,逐步缩小差距,甚至在某些细分领域实现超越。科研实力、资本支持与产业化落地的深度结合,为中国在这一领域赢得更多主动权提供了坚实基础。
未来,存算一体技术不仅是推动科技创新的核心力量,更可能成为智能时代发展的重要引擎。无论是千亿级市场的扩展,还是产业链的全面升级,存算一体都将书写计算架构的新篇章。我们站在历史的交汇点上,见证着技术的飞跃,也迎来了全新的发展机遇。在这场通向智慧未来的旅程中,存算一体技术,正在为我们打开无限可能的大门。
*参考文献
[1]中国移动研究院. (2022). 存算一体白皮书 [R].
[2]中国信息通信技术研究院. (2021). 中国算力发展指数白皮书 [R].
[3]林钰登. (2019). 基于新型忆阻器的存内计算. 微纳电子与智能制造.
[4]尹勋钊. (2022). 存算一体电路与跨层次协同设计优化:从SRAM到铁电晶体管. 中国科学.
[5]丁士鹏. (2021). 基于NOR Flash的存算一体模拟乘加电路设计. 信息技术与网络安全.
[6]冒伟, 刘景宁, 等. (2015). 基于相变存储器的存储技术研究综述. 计算机学报.
[7]Amir Gholami. (2022). AI and Memory Wall [Online]. Retrieved from https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8
[8]Tanachutiwat, S., Ming, L., & Wei, W. (n.d.). FPGA Based on Integration of CMOS and RRAM [M].
[9]Tehrani, S., Engel, B., Chen, E., et al. (2000). Recent developments in magnetic tunnel junction MRAM. In IEEE International Magnetics Conference (pp. xx-xx). IEEE.
来源:投资五部 许希文
审核:薛瑶
发布:尤异
相关附件