网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于江南体育

公司概况 核心优势 核心团队 发展历程

联系江南体育

官方微信

官方微博

主页 > 新闻中心

英伟达江南体育被“偷家”？全新AI芯片横空出世速度比GPU快十倍

发布时间：2024-06-26 20:24浏览次数：来源于：网络

　　江南体育《科创板日报》由上海报业集团主管主办，财联社出品。专注新兴产业与资本，是科创板、新兴产业及资本的重要舆论前沿，深度覆盖新一代信息技术、半导体、生物医药、新能源、新材料、基金等，提供媒体、数据、城市、投行等产品体系服务。
　　芯片推理速度较英伟达GPU提高10倍、成本只有其1/10；运行的大模型生成速度接近每秒500 tokens，碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天，一家名为Groq的初创公司在AI圈爆火。
　　Groq读音与马斯克的聊天机器人Grok极为接近，成立时间却远远早于后者。其成立于2016年，定位为一家人工智能解决方案公司。
　　在Groq的创始团队中，有8人来自仅有10人的谷歌早期TPU核心设计团队。例如，Groq创始人兼CEO Jonathan Ross设计并实现了TPU原始芯片的核心元件，TPU的研发工作中有20%都由他完成江南体育，之后他又加入Google X快速评估团队，为谷歌母公司Alphabet设计并孵化了新Bets。
　　虽然团队脱胎于谷歌TPU，但Groq既没有选择TPU这条路江南体育，也没有看中GPU、CPU等路线。Groq选择了一个全新的系统路线——LPU（Language Processing Unit，语言处理单元）。
　　“我们（做的）不是大模型，”Groq表示，“我们的LPU推理引擎是一种新型端到端处理单元系统，可为AI大模型等计算密集型应用提供最快的推理速度。”
　　从这里不难看出，“速度”是Groq的产品强调的特点，而“推理”是其主打的细分领域。
　　Groq也的确做到了“快”，根据Anyscale的LLMPerf排行显示，在Groq LPU推理引擎上运行的Llama 2 70B，输出tokens吞吐量快了18倍，优于其他所有云推理供应商。
　　第三方机构artificialanalysis.ai给出的测评结果也显示，Groq的吞吐量速度称得上是“遥遥领先”。
　　为了证明自家芯片的能力，Groq还在官网发布了免费的大模型服务，包括三个开源大模型，Mixtral 8×7B-32K、Llama2-70B-4K和Mistral 7B - 8K，目前前两个已开放使用。
　　LPU旨在克服两个大模型瓶颈：计算密度和内存带宽。据Groq介绍，在 LLM 方面，LPU较GPU/CPU拥有更强大的算力，从而减少了每个单词的计算时间江南体育，可以更快地生成文本序列。此外，由于消除了外部内存瓶颈，LPU推理引擎在大模型上的性能比GPU高出几个数量级。
　　据悉，Groq芯片完全抛开了英伟达GPU颇为倚仗的HBM与CoWoS封装，其采用14nm制程，搭载230MB SRAM，内存带宽达到80TB/s。算力方面，其整型（8位）运算速度为750TOPs，浮点（16位）运算速度为188TFLOPs。
　　值得注意的是，“快”是Groq芯片主打的优点，也是其使用的SRAM最突出的强项之一。
　　SRAM是目前读写最快的存储设备之一，但其价格昂贵，因此仅在要求苛刻的地方使用，譬如CPU一级缓冲、二级缓冲。
　　华西证券指出，可用于存算一体的成熟存储器有Nor Flash、SRAM、DRAM、RRAM、MRAM等。其中，SRAM在速度方面和能效比方面具有优势，特别是在存内逻辑技术发展起来之后，具有明显的高能效和高精度特点。SRAM、RRAM有望成为云端存算一体主流介质。

下一篇：江南体育官网华为AI芯片
上一篇：安谋计划明年推出 AI 芯片软银大愿景下江南机器人和发电也想通吃

咨询我们

输入您的疑问及需求发送邮箱给我们

相关新闻推荐

江南体育官网华为AI芯片 2024-06-26

英伟达江南体育被“偷家”？全新AI芯片横 2024-06-26

安谋计划明年推出 AI 芯片软银大愿景 2024-06-26

江南体育官网2024寒武纪中国AI芯片巨 2024-06-26

JN SPORTSai芯片技术架构有哪些 2024-06-25

云天励飞：AI推理芯片及大模型标准江南体 2024-06-24

简历投递

admin@yochibike.com

商务合作

admin@yochibike.com

媒体垂询

admin@yochibike.com

产品中心: 智能终端处理器智能云服务器软件开发环境

新闻中心

关于江南体育: 公司概况核心优势核心团队发展历程

关注腾讯

微信二维码

微博二维码

Copyright © 2002-2022 江南人工智能科技有限公司版权所有备案号：浙ICP备2022029655号-1