网站首页

产品中心

智能终端处理器 智能云服务器 软件开发环境

新闻中心

关于江南体育

公司概况 核心优势 核心团队 发展历程

联系江南体育

官方微信

官方微博

主页 > 新闻中心

全新AI芯片来了速度10倍江南体育官网于GPU！英伟达要翻了吗？

发布时间：2024-05-24 09:42浏览次数：来源于：网络

　　JN SPORTS这几天，Sora横空出世，让AI大模型的热度又上升了不止一个level。
　　在AI推理技术上，这款芯片通过优化架构和减少内存瓶颈，在处理大模型时实现了高效率和低延迟，速度超过英伟达GPU（图形处理器）10倍。
　　刚过去的一年，ChatGPT爆火引发AI算力需求热潮，英伟达AI芯片大规模短缺，供不应求。
　　除了Groq，科技巨头微软也在研发一种新的网卡芯片，意欲替代英伟达ConnectX SmartNIC智能网卡产品。OpenAI也被曝出计划花费“7万亿”造芯的传闻。
　　受上述消息及外部环境影响，截至2月20日美股收盘，英伟达单日股价下跌4.35%，一夜之间总市值缩水780亿美元（约5600亿元人民币）。
　　随着Sora的推出，多模态大模型对AI算力的消耗更高，算力的可获取性以及成本将是行业挑战之一。
　　据介绍，Groq的LPU芯片推理速度较英伟达GPU提高10倍，运行的大模型生成速度接近每秒500 tokens，直接碾压GPT-3.5近40 tokens/秒的速度。
　　还有更直观的列表对比。据Groq在2024年1月的第一个公开基准测试，由Groq LPU驱动的Meta Llama 2-70B模型，推理性能比其他顶级云计算供应商快18倍。
　　第三方机构artificialanalysis.ai给出的测评结果也显示，Groq的吞吐量速度称得上是“遥遥领先”。
　　Groq成立于2016年，由谷歌TPU团队原班人马创立，定位于基于自研芯片推出推理加速方案。
　　Groq创始人兼 CEO乔纳森·罗斯（Jonathan Ross）曾设计并制作出了第一代谷歌TPU芯片的核心元件，TPU20%的研发项目都由他完成。
　　在Groq的创始团队中，有8人来自仅有10人的谷歌早期TPU核心设计团队。
　　虽然团队脱胎于谷歌TPU，但Groq没有选择TPU、GPU、CPU等路线，而是选择了一个全新的系统路线——LPU。
　　“我们（做的）不是大模型，”Groq表示，“我们的LPU推理引擎是一种新型端到端处理单元系统，可为AI大模型等计算密集型应用提供最快的推理速度。”
　　不难看出，“速度”是Groq的产品的最显著特点，而“推理”是其主打的细分领域。
　　之所以速度飞起，核心奥义在于LPU克服了两个大模型瓶颈——计算密度和内存带宽。
　　据Groq介绍，在LLM方面，LPU较GPU/CPU拥有更强大的算力，从而减少了每个单词的计算时间，可以更快地生成文本序列。此外，由于消除了外部内存瓶颈，LPU推理引擎在大模型上的性能比GPU高出几个数量级。
　　Groq表示，英伟达GPU生成每个tokens需要约10焦耳到30焦耳，而Groq仅需1焦耳到3焦耳。因此，推理速度提高10倍，成本却降低十分之一，相当于性价比提高了100倍。
　　在第三方网站上，搭载Groq芯片的加速卡售价为2万多美元，差不多15万人民币。
　　虽然Groq的芯片成本较高江南体育官网，但其创始人Jonathan Ross表示江南体育官网，随着GPU短缺和成本上升，Groq的LPU将有巨大的市场潜力。
　　不是喊话奥特曼“你们推出的东西太慢了……”，就是痛斥马斯克“剽窃”自己的名字。毕竟，Groq与马斯克的X AI团队的大模型Grok读音确实也太相近了。
　　最近，Groq似乎又有了新操作。一名自称Groq工作人员的用户与网友互动时表示，Groq的目标是打造最快的大模型硬件，并扬言：
　　有分析人士称，在A100和H100相对紧缺的时代，LPU或许会成为大模型开发商的新选择。
　　其实，不止Groq在挑战英伟达的“霸主”地位，不少科技巨头也纷纷布局AI芯片。
　　据媒体报道，全球最高市值的科技巨头微软正在开发一款新的网卡芯片，类似于英伟达的网卡 ConnectX-7，用它确保数据在微软的服务器之间快速移动。
　　除了微软，亚马逊旗下云计算部门AWS、Meta等科技巨头也在自研对标英伟达A100的多款AI芯片产品。
　　2023年11月，AWS推出全新基于ARM架构、自研的高性能计算服务器CPU芯片Graviton 3E，同时发布第五代Nitro网络芯片硬件，借此提升云端虚拟机的计算效率。
　　2月5日，Meta正式计划今年部署一款新的自研 AI 芯片，即第二代自研AI芯片Artemis，预计将于2024年正式投产，以减少对英伟达芯片的依赖。
　　不久前，奥特曼公布通过筹集7万亿美元制造AI芯片，目前正与日本软银集团、阿联酋政府、美国商务部及其他中东主权财富基金等投资者洽谈江南体育官网。
　　有分析人士表示，微软和其他云提供商都“不想受制于英伟达（Nvidia）生态系统”。
　　2月20日，Lepton AI创始人兼CEO 贾扬清分析称，如果运行未来三年的话，Grog的硬件采购成本是1144万美元，运营成本远高于76.2万美元，而同等性能的8卡英伟达H100 的硬件采购成本仅30万美元，运营成本大约为7.2万美元以内。英伟达的性价比显然更高。
　　另外，目前LPU仅用于推理，而为了训练模型，很多公司仍少不了使用NVIDIA GPU或类似的芯片。
　　对于奥特曼的7万亿美元计划，黄仁勋则称，（7万亿美元）显然能买下所有GPU。
　　黄仁勋曾坦言，这些云计算厂商自研AI芯片是有一定理由的，主要还是服务自家的数据中心，但这不会影响英伟达在全球的AI生态系统发展。
　　截至2月20日美股收盘，英伟达单日股价下跌4.35%，创下去年10月以来的最大单日跌幅，一夜之间总市值蒸发780亿美元（约5600亿元人民币）。

下一篇：JN SPORTSAI芯片点燃半导体封装产业链复苏曙光初现
上一篇：江南体育AIIA发布业界权威AI芯片目录集：芯片技术选型目录

咨询我们

输入您的疑问及需求发送邮箱给我们

相关新闻推荐

JN SPORTSAI芯片点燃半导体封 2024-05-24

全新AI芯片来了速度10倍江南体育官网于 2024-05-24

江南体育AIIA发布业界权威AI芯片目录 2024-05-23

AI芯片架构、分类、关键技术 - CPU 2024-05-23

全球AI芯片排行榜出炉中国华为榜上江南 2024-05-23

江南体育官网AI算力芯片板块5月17日涨 2024-05-21

简历投递

admin@yochibike.com

商务合作

admin@yochibike.com

媒体垂询

admin@yochibike.com

产品中心: 智能终端处理器智能云服务器软件开发环境

新闻中心

关于江南体育: 公司概况核心优势核心团队发展历程

关注腾讯

微信二维码

微博二维码

Copyright © 2002-2022 江南人工智能科技有限公司版权所有备案号：浙ICP备2022029655号-1