网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于江南体育

公司概况 核心优势 核心团队 发展历程

联系江南体育

官方微信 官方微博
主页 > 新闻中心

江南体育一文看懂国内外AI芯片产品对比

发布时间:2024-01-30 17:18浏览次数: 来源于:网络

  JN SPORTSAI芯片也被称为AI加速器或计算卡,是专门用于处理人工智能训练和推理任务的专用硬件。当前,主要包括GPU、FPGA、ASIC等(其他非计算任务仍由CPU负责)。这些芯片具备高度并行性和能够实现低功耗高效计算的特点。随着AI应用的广泛普及和对算力的不断增加需求,AI芯片的需求有望成为首要扩张的领域。

  数据显示,截至2022年底,我国算力总规模达到180百亿亿次浮点运算/秒,存力总规模超过1000EB,即1万亿GB。算力产业的规模正在以惊人的速度增长。根据IDC预测,预计到2026年,我国浮点运算次数将达到1271.4 EFLOPS,在2022-2026年期间,年均复合增长率预计将达到52.3%。在这种背景下,IDC预测,未来18个月内,全球范围内人工智能服务器上GPU、ASIC和FPGA的使用率都将上升。预计到2025年,人工智能芯片市场规模将达到726亿美元。

  CPU:在AI计算中,CPU是基础,负责控制和协调所有的计算操作,是整个计算过程的控制核心。它承担着读取和准备数据的任务,并将数据传输到GPU等协处理器进行计算,最终再输出计算结果。CPU在深度学习中具有出色的逻辑控制能力,尤其适用于推理/预测任务。AI产品在推理过程中,需要实时对大量经过训练的模型进行推理/预测操作,而这种操作通常需要高效的逻辑控制能力和低延迟的响应速度,这正是CPU的优势所在。

  GPU:最初GPU是为了满足计算机游戏等图形处理需求而开发的,但由于其出色的并行计算和大规模数据处理能力,逐渐被广泛应用于通用计算领域。目前,GPU已经占据了AI芯片市场的主要份额。根据应用场景和处理任务的不同,GPU形成了两个分支:传统GPU主要用于图形图像处理,内置了一系列专用运算模块,如视频编解码加速引擎、2D加速引擎和图像渲染等。GPGPU(通用计算图形处理器),为了更好地支持通用计算,GPGPU减弱了GPU的图形显示部分能力,并将其余部分全部投入到通用计算中。同时,GPGPU增加了专用的向量、张量和矩阵运算指令,提升了浮点运算的精度和性能。这使得GPU成为人工智能和专业计算等加速应用的理想选择。

  FPGA:(现场可编程逻辑门阵列)是在可编程阵列逻辑(PAL)、通用阵列逻辑(GAL)等可编程器件的基础上进一步发展而来的。FPGA最显著的特点在于其现场可编程性,与CPU、GPU或ASIC等芯片不同,这些芯片的功能在制造完成后就被固定,无法进行硬件功能的更改。而FPGA在制造完成后仍然可以使用配套的软件对芯片进行功能配置,将芯片上的空白模块转化为具备特定功能的模块,从而满足用户的需求。FPGA具有可编程性、高并行性、低延迟和低功耗等特点,这使得它在AI推断领域具有巨大的潜力。目前,FPGA广泛应用于线上数据处理中心和军工单位等领域。

  ASIC:(专用集成电路)是一种专门为满足特定用户需求和特定电子系统设计和制造的集成电路。ASIC在性能、能效和成本等方面超越了标准芯片,具有较高的能效比和算力水平,非常适合AI计算场景,成为许多AI初创公司开发的目标产品。然而,ASIC在研发和制造方面的一次性成本较高。设计和验证ASIC芯片需要大量的工程资源和时间,从而导致研发成本的增加。但一旦ASIC量产,后续的平均成本会显著降低,具备批量生产的成本优势。目前,ASIC主要应用于推断场景,其中在终端推断市场份额最大,而在云端推断市场增长较快。

  目前全球服务器CPU市场被Intel和AMD所垄断,国内CPU厂商在性能方面仍与国际领先水平存在差距。根据Counterpoint的数据显示,2022年全球CPU市场中,Intel以70.77%的市场份额位居第一,AMD以19.84%的份额排名第二,而其他厂商仅占据9.39%的市场份额。整体上市场被两大厂商所主导。目前国内的CPU厂商包括海光、海思江南体育、飞腾、龙芯、申威等。尽管国内CPU厂商的服务器产品性能已接近Intel中端产品水平,但从整体上看,国内在工艺制程、运算速度(主频)以及多任务处理(核心与线程数)等方面仍落后于国际先进水平。

  当前全球GPU芯片市场同样被海外厂商垄断江南体育,由NVIDIA、Intel和AMD三家巨头主导,其中NVIDIA凭借其CUDA生态系统在人工智能和高性能计算领域占据绝对主导地位。在国内市场中,景嘉微一直致力于图形渲染GPU领域,而天数智芯、壁仞科技、登临科技等初创企业则专注于人工智能和高性能计算的通用GPU(GPGPU)领域,并且正在加快发展步伐。

  就图形渲染GPU而言,国内厂商与国外龙头厂商之间的差距正在不断缩小。芯动科技的“风华2号”GPU采用了5纳米制程,与NVIDIA最新一代产品RTX40系列相媲美,实现了国产图形渲染GPU的突破。景嘉微在工艺制程、核心频率和浮点性能等方面虽然落后于NVIDIA同代产品,但差距正在逐渐缩小。

  在GPGPU方面,国内厂商与NVIDIA之间仍存在较大差距。在制程方面,NVIDIA已经率先推出了4纳米制程,而国内厂商主要集中在7纳米制程。在算力方面,国内厂商大多不支持双精度(FP64)计算,但在单精度(FP32)和定点计算(INT8)方面与国外中端产品持平,天数智芯和壁仞科技的人工智能芯片产品在单精度性能上超过了NVIDIA的A100。在接口方面,壁仞科技和NVIDIA率先采用了PCIe 5.0,而其他厂商多数还在使用PCIe 4.0。在生态方面,国内企业多采用OpenCL进行自主生态建设,与NVIDIA成熟的CUDA生态相比,仍存在明显差距江南体育。

  FPGA全球市场呈现出一种“两大两小”的格局,其中Altera(阿尔特拉,2015年被英特尔收购)和Xilinx(赛灵思)两家公司的市场份额总计超过80%,而Lattice(莱迪思)和Microsemi(美高森美)的市场份额总计超过10%。国产方面,安路科技、紫光同创等国内厂商处于国际中端水平,但仍需要进一步突破。在工艺制程方面,目前国内厂商的先进制程主要集中在28纳米,落后于国际水平的16纳米。而在等效逻辑单元(LUT)数量方面,国内厂商的旗舰产品大约为20万个,仅相当于Xilinx高端产品的25%左右。

  ASIC与CPU、GPU和FPGA有着不同的特点,目前全球ASIC市场尚未形成明显的头部厂商,而国内ASIC厂商正在迅速发展。通过产品对比可以发现,目前国内厂商主要采用与国外ASIC厂商相同的7纳米工艺制程。在算力方面,海思的昇腾910在BF16浮点算力和INT8定点算力方面超越了Google最新一代产品TPUv4,而遂原科技和寒武纪的产品在整体性能上也可以与Google相媲美。

  龙芯中科于2008年由中科院和北京市政府共同牵头出资成立,2022年6月,在科创板上市。龙芯中科是一家专注于处理器(CPU)及配套芯片的研发、销售和服务的公司,同时也是国内唯一自主掌握高性能CPUIP知识产权、具备系列化CPUIP核授权条件的企业。主要产品包括龙芯1号、龙芯2号和龙芯3号等处理器芯片系列,以及与之配套的桥接芯片等。这些产品在电子政务、能源、交通、金融、电信、教育等行业领域得到广泛应用。

  龙芯中科坚持自主研发指令系统、IP核等核心技术。掌握了指令系统、处理器核微结构、GPU以及各种接口IP等核心芯片技术,并进行自主研发,拥有大量的自主知识产权,已获得400多项专利。今年4月,龙芯推出了2023款HPC CPU:3D5000。这款处理器拥有32个核心,主频高达2 GHz,热设计功耗(TDP)为300瓦特。据称,该处理器的性能比典型的Arm芯片快了4倍。为了实现这一性能提升,龙芯采用了两个现有的3C5000芯片的小芯片封装方式。这款处理器主要面向国内服务器细分市场和高性能计算(HPC)客户。

  景嘉微成立于2006年,2016年3月公司在深交所创业板上市。公司专注于高可靠性电子产品的研发、生产和销售,涵盖图形显控、小型专用化雷达和芯片领域等产品。其中,图形显控是公司的核心业务和传统优势,而小型专用化雷达和芯片则是公司未来发展的重点领域。

  在GPU研发方面,景嘉微公司的进展平稳,推出的新产品能够满足人工智能计算的需求。公司从JM5400系列开始,不断研发更先进且适用范围更广的GPU芯片。2014年,公司推出了JM5400,核心频率为550MHz;2018年,推出了JM7200系列,核心频率为1300MHz;2021年,推出了JM9系列,核心频率达到1.5GHz。

  根据公司2022年中期报告显示,2022年5月公司成功研发了JM9系列的第二款图形处理芯片。该芯片能够满足地理信息系统、媒体处理、CAD辅助设计、游戏、虚拟化等对高性能显示和人工智能计算需求的广泛应用。它可用于台式机、笔记本电脑、一体机、服务器、工控机、自助终端等设备。这进一步证明了景嘉微公司在GPU领域的技术实力和产品创新能力。

  寒武纪是AI芯片领域的独角兽公司,成立于2016年,2020年7月在科创板上市。公司专注于人工智能芯片产品的研发和技术创新,产品广泛应用于消费电子、数据中心、云计算等多个领域。作为AI芯片领域的独角兽,寒武纪已取得了显著成就:采用公司终端智能处理器IP的终端设备出货量超过亿台;云端智能芯片及加速卡已成功应用于国内主流服务器厂商的产品,并实现了大规模量产;发布边缘智能芯片及加速卡。

  人工智能在各种应用场景中的发展,从云端向边缘端扩展甚至下沉到终端设备,都离不开高效的智能芯片的支持。为此,寒武纪面向云端、边缘端和终端推出了三个系列不同品类的通用型智能芯片和处理器产品。其中,终端智能处理器IP适用于终端设备,云端智能芯片及加速卡适用于云计算场景,而边缘智能芯片及加速卡则专注于边缘计算应用。这种产品布局意味着寒武纪能够全面满足各种场景对智能芯片的需求。返回搜狐,查看更多

下一篇:AI芯片百花齐放 盘点2020年十江南体育大AI芯片
上一篇:江南体育AI模拟芯片能效达传统芯片14倍

咨询我们

输入您的疑问及需求发送邮箱给我们