网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于江南体育

公司概况 核心优势 核心团队 发展历程

联系江南体育

官方微信 官方微博
主页 > 新闻中心

江南盘点 AI 芯片2021:打破“两面墙”存算一体成趋势

发布时间:2024-04-30 22:43浏览次数: 来源于:网络

  江南体育官网新型基础设施的完善,推动了人工智能技术在消费领域以及工业生产领域的应用,落地场景趋向细分化、垂直化。当人工智能进一步发展,深度学习模型的复杂度不断增加,硬件和内存逼近临界点,CPU 这样的通用芯片无法满足人工智能任务要求时,AI 芯片应运而生。与此同时,随着智能物联时代掀开序幕江南,越来越多的数据开始在云、边、端流动。急剧增长的数据量对 AI 芯片的算力和功耗提出了更高要求。AI 芯片是专门用于处理人工智能应用中大量计算任务的模块,主要分为 GPU、FPGA、ASIC。其中 GPU 主要处理图像领域的运算加速,是最先被引入深度学习的类型,技术相对成熟;FPGA 是一种可以重构电路的芯片,用户可以根据需求进行重复编程,适用于多指令和数据流的分析,性能出众但技术壁垒较高;ASIC 即专用集成电路,除了不能扩展外,在功耗、可靠性方面均有优势,可定制、低成本是其显著特点。

  在“缺芯少魂”的危机意识倒逼下,中国加大自主研发力度寻求破局。BAT 互联网大厂自研 AI 芯片均已揭晓。

  百度发布了自主研发的第二代昆仑 AI 芯片“昆仑芯 2”,并宣布实现量产。2 代采用 7nm 制程,通用性显著增强,可应用于互联网、智慧城市、智慧工业等领域;

  腾讯在其数字生态大会上也公布了自研芯片的进展,AI 推理芯片紫霄性能目前已经流片成功并顺利点亮。

  在投融资领域,国内 AI 芯片赛道也颇为热闹。超 40 家 AI 芯片企业在 2021 年拿下新融资。地平线、黑芝麻智能、燧原科技、壁仞科技、昆仑芯、摩尔线 亿人民币。

  相较于国内的百花齐放,国外 AI 芯片的格局要清晰得多。英伟达和英特尔依然占据了人工智能算力领域的主导位置,而率先闯进独角兽阵营的欧美 AI 芯片企业仅有 6 家,分别是获得谷歌首个 AI 芯片投资的 SambaNova Systems,将“史上最大”晶圆级芯片卖给阿联酋云计算公司的 Cerebras Systems江南,来自英国的 Graphcore,创始团队曾是谷歌 TPU 核心研发成员的 Groq,业界大神吉姆·凯勒的新东家 Tenstorrent 和主攻边缘 AI 芯片的以色列初创公司 Hailo。

  总体来说,受益于存量需求替代以及增量需求释放,芯片行业将迎来新一轮增长契机。但目前产能不足仍是困扰全球芯片行业的主要问题。在芯片应用领域,中国是目前全球最大的芯片应用市场,但芯片自给率依然是一大挑战。放眼整个芯片市场,中国仍处于追赶阶段,还未掌握话语权。尽管现在国内的芯片厂商不少,但在制程工艺上与国际领先水准差距依然很大,此外芯片制造短板也不容忽视。

  但“危机”二字本就蕴藏着“转危为机”的可能。国务院印发的《新时期促进集成电路产业和软件产业高质量发展的若干政策》表明,发展集成电路产业已经上升到国家战略高度。未来相信会有更多的资本和企业加入到芯片设计制造行列。

  回顾 2021 年,值得关注的是,在 AI 芯片步入发展快车道的同时,基于下游应用的强驱动,AI 芯片的技术创新进程得到推进。其中最引人瞩目的是,曾经长期止步于理论阶段的“存算一体架构”芯片取得了较好的进展,少数企业已经有成品问世。目前来看,存算一体 AI 芯片将成为未来主流的发展方向。

  在传统冯·诺伊曼架构下,计算和存储分离,两者间通过数据总线进行数据传输。计算单元从内存中读取数据,计算完成后存回内存。但随着 AI 芯片的发展,这种架构也成为制约计算系统性能提升的主要瓶颈之一。一方面,存储和计算之间性能不匹配的问题长期存在,存储器的数据访问速度跟不上计算单元的数据处理速度,存储器带宽在很大程度上限制了处理器的性能发挥,“存储墙”日益严重,算力提升受限;另一方面,AI 计算往往要面临海量数据,数据总线的有限带宽严重制约处理器的性能与效率,而且大量数据传输导致功耗居高不下,“功耗墙”挑战日盛。

  由于两只拦路虎——“存储墙”和“功耗墙”的存在,冯·诺依曼计算架构的局限性日益凸显,因此亟需新型的计算架构应对未来应用场景的挑战。在这一背景下,存算一体的概念重新进入业界视野。

  “存算一体”并非新事物,其概念的提出最早可追溯到 20 世纪 60 年代,但受限于制作成本、制作工艺及需求驱动等问题,并未掀起多澜。直到近年来人工智能的发展逐渐迈向正轨,存算一体才有机会崭露头角。由于在存储单元内完成运算,这就直接解决 困扰业界许久的“存储墙”问题,减少了数据搬运过程中高达 90% 的功耗消费。同时,这种架构也减少了等待数据读取时算力的浪费,实际性能更好。这种优势被认为是解决 AI 特定场景需求的关键。

  国内外在存算一体方面都还处于起步阶段,因此无论是行业龙头还是初创公司都在积极蓄力,希望在这一赛道保持领先或实现弯道超车。

  国外巨头中,三星的动向值得持续关注。2021 年 2 月,三星发布了 HBM-PIM 存内计算技术,在高带宽内存 (HBM) 配置中集成内存处理 (PIM) 。这也是业界第一个 HBM 集成 AI 处理能力的芯片。据官方资料显示,与现有的内存解决方案相比,三星的 PIM 理论上可以通过可编程计算单元 (PCU) 提高 4 倍的性能。

  另外,美国 AI 芯片初创公司 Myhtic 也是该领域的重要参与者。在 2021 年 C 轮融资中,Mythic 筹集 7000 万美元,自成立以来 Mythic 的总融资额已达到 1.652 亿美元。2020 年年底,Mythic 推出了其第一代 AI 芯片 M1108 AMP。与很多 AI 芯片不同,M1108 基于更加成熟的模拟计算技术,将足够的存储与大量并行计算单元打包在芯片上江南,以最大化内存带宽并减少数据移动的能力。

  除了阿里外,众多初创公司也开始在这个赛道发力,知存科技、后摩智能、九天睿芯等皆是个中翘楚。

  成立于 2017 年的知存科技推出了国际首个存算一体加速器 WTM1001 和首个存算一体 SoC 芯片 WTM2101。截止 2021 年,知存科技已完成累计近 3 亿元的 A 轮系列融资。

  后摩智能作为国内首家采用存算一体技术打造大算力芯片的公司,其愿景也十分清晰:打造出具有“十倍效应”的 AI 芯片, 致力于满足真正人工智能时代的超大算力需求。

  九天睿芯成立于 2018 年,专注于神经拟态感存算一体芯片研发。2021 年,九天睿芯已设计出基于 SRAM 的感存算一体架构芯片 ADA20X,可广泛应用于多种视觉场景。

  当前,存算一体芯片聚焦于低延迟、低功耗、高算力需求的边缘计算,主要应用于音频类、健康类及低功耗视觉端侧应用场景中。随着 AI 应用日益丰富,在推进规模化应用阶段,终端厂商必然会关注成本问题,而成本和功耗有着直接的关系,低功耗的 AI 芯片往往意味着它能够实现整机低成本。这对于存算一体芯片来说无疑是一片蓝海。

  任何一项技术都不是“万金油”,存算一体亦然,它只针对某一类计算特别是以数据为主的 AI 计算,并不适合 CPU 等以控制为主的计算。而且这种架构正处于学术界向工业界迁移的关键时期,要真正实现转化成功,一方面要求对存算一体技术有深刻的洞察,另一方面也要对 AI 应用落地有透彻的理解,两者相结合才可能发生质变,取得实质性突破。

  此外,存算一体作为新的芯片方向,还面临电路设计、架构、软件等诸多层面的挑战。由于存算一体芯片和常规的芯片设计方案不同,目前市面上也没有成熟的专用 EDA 工具辅助设计和仿真验证;芯片流片之后,没有成熟的工具协助测试;在芯片落地应用阶段,也缺乏专用的软件与之适配。如何完善重要技术的生态链,是行业上下游厂商应该共同考虑的问题。

  “时势造英雄。”每一次计算构架的大变革都会创造一个新的王者。从主机时代的 IBM、PC 时代的英特尔、移动时代的高通,现在进入智能物联网的时代,问芯片天下,谁主沉浮?我们拭目以待。

  一直以来,一提到轻薄的设备,无论是超轻薄笔记本还是一体电脑,无不被打上商务的烙印,为什么如此呢实际上商务在一定程度上是低性能的代名词,寓意着其仅仅能承受一般的商务应用,但对于一些较为苛刻的娱乐应用来说则有些力不从心。以至于在过去很多人都认为一体电脑是个鸡肋,它仅仅是那些小资白领摆弄个性的产品,市场前景并不乐观。

下一篇:JN SPORTS如何打造代差级AI CPU芯片
上一篇:江南盘点 AI芯片这么多你更看好哪个?

咨询我们

输入您的疑问及需求发送邮箱给我们