时代财经APP
企业第一财经读本
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
对国内大模型厂商而言,增加国产AI芯片比重仍是必然之举。
图片来源:Pixabay
算力芯片的火,从2023年一直燃烧到2024年。
开年不久,英伟达CEO黄仁勋时隔四年到访中国大陆,还穿上了东北大花袄与国内员工共舞,气氛无比热络,似乎是在对自家芯片遇冷的传言进行某种回应。
2023年,英伟达的AI芯片成了科技界的硬通货,一度一片难求,英伟达业绩也水涨船高,其2024财年第三季度财报显示,期内英伟达录得营收181.2亿美元,比去年同期增长206%,远高于市场预期的162亿美元,创纪录新高。
但近期,情况似乎发生了变化。据参考消息网,自去年11月以来,中国互联网大厂就开始在测试英伟达“中国特供版”AI芯片样品,结果并不理想——由于算力不足,相关公司已暗示英伟达,今年订购的英伟达芯片数量将远少于原计划。
因此,黄仁勋在这个特殊时间节点突然到访,引发了市场诸多猜测与遐想。有业内人士认为,在国内厂商不愿购买性能缩水的英伟达特供版芯片的情况下,黄仁勋来到中国大陆,很有可能是为了稳住国内团队和头部客户,并了解市场对英伟达产品的需求和反馈,以便进行相应的产品和策略调整。
对此,英伟达方面也回应媒体称,黄仁勋的到访并未涉及与政府官员的会面,也没有重大的商业发布,最主要的目的是与中国员工“欢度美好时光”。
“这反映出我国相关产业在国际竞争中的地位逐渐上升。”深度科技研究院院长张孝荣向时代财经记者分析表示,在政策端的支持以及国内企业的不断努力下,国内外芯片算力的差距已在不断缩小,这给予了国内头部大模型厂商转投国产芯片的底气,也为英伟达敲响了警钟。
H20“遇冷”真相
2023年10月,为了绕过限制并满足中国大陆市场需求,英伟达着手推出三款基于其AI芯片H100的“降级版”芯片:H20、L20和L2,并计划在今年二季度量产。
然而这一针对中国市场研发的特供芯片未获市场认可。性能上的不足,被普遍认为是英伟达芯片遇冷的主要原因。
官方资料对比显示,H20为三款芯片中性能最佳的一款,更适用于垂类模型的训练、推理。H20的内存高达96GB,整数精度(INT8)算力为296TOPS;L20则配有48 GB内存,整数精度(INT8)算力为239TFLOP;L2配置为24GB内存以及算力为193TFLOP。
然而即便是三款芯片中最强大的是H20芯片,其运算能力与H100相比还是大幅缩水。
半导体研究机构Semianalysis调研报告曾显示,理论上H20整体算力比英伟达H100下降80%左右,但在大语言模型(LLM)推理方面的性能比H100快20%,同时配置的HBM3显存和NVLink互联模块增加了不小成本。
此外,多位业内人士向时代财经记者分析表示,性能表现不及预期,并非H20在华遇冷的唯一原因。
华芯金通半导体产业研究院院长吴全向时代财经记者指出,从2023年大模型爆火以来,国内一众云计算、大模型厂商就已经开始积极囤货,大批量购买A800、H800等英伟达芯片,目前已部署的服务器总量尚能支撑市场需求,故而对“减量不减价”的H20兴致缺缺。
而前人工智能NLP企业首席科学家、千芯科技董事长陈巍进一步向时代财经记者透露,国内交易市场中还囤积有大量英伟达GPU芯片等待消化。这也给予国内大模型厂商一定的选择余地。
“估计还有20%的存货没有出清。”陈巍表示。
时代财经记者通过询问小红书、闲鱼APP等线上渠道,以及线下走访华强北芯片交易市场后发现,相比半年前囤货惜售的场景,现在经销商手中英伟达存货普遍较多,侧面印证了陈巍的说法。
多位卖家向时代财经记者透露,其目前拥有A100芯片现货在50个以上,配置不同报价略有波动,单个售价集中在12万到18万元区间内,相较去年下半年价格维持稳定。也有卖家要求50-100个起售,交货周期为1个月,可在中国香港、日本、新加坡进行交易。
此外,陈巍强调,当下市场的观望态度也与英伟达自身的动作息息相关。
除H20外,2023年底,英伟达中国又在官网发布了定制的GeForce RTX 4090 D。随后,又于今年1月初,推出了全新消费级显卡GeForce RTX 40 SUPER系列,包括RTX 4080 SUPER、RTX 4070 Ti SUPER 和 RTX 4070 SUPER三款GPU,均具备强劲的生成式AI性能。英伟达副总裁Justin Walker在发布会上强调,英伟达发布的新显卡符合出口要求,可以提供给中国大陆消费者。
陈巍认为,考虑到多数国内大模型厂商的发展趋势是针对垂直领域开发数十亿参数量级或百亿参数量级的中小模型,而不是开发类似GPT-3.5 175B这样的千亿级大模型。因此对于云计算和IDC厂商来说,4090D等消费级显卡在云部署与推理计算上更具备性价比,H20的吸引力进一步下降。
国产自研AI芯片加速
在爆出H20等“降级版”芯片在华遇冷的同时,参考消息网的相关报道称,“短期来看,英伟达降级版芯片与中国本土芯片在性能上的差距不断缩小,增强了中国自产芯片的吸引力。据知情人士称,阿里巴巴和腾讯正将一部分高性能AI芯片的订单转给本土企业,并更多地依赖内部自研芯片。中国另外两大芯片买家字节跳动和百度也是如此。”
时代财经记者通过采访以及公开资料梳理发现,目前国产AI芯片主要可以分为三类:其一是大型科技企业自研的AI芯片,二是海光信息这类国资背景的科技公司,三是壁仞科技、天数智芯、摩尔线程、燧原科技、寒武纪等创业型芯片公司。
据晚点统计,上述芯片峰值算力大多相当于英伟达A100的41%到82%。
从实际落地情况来看,绝大部分厂商仍处在商业化应用的早期阶段,仍停留在具体场景下的应用。
目前,国内已有科技企业具备全栈AI软硬产品,能够真正大规模量产并投入业务使用。其研发的核心产品被普遍认为是性能表现最接近英伟达的国产AI芯片。科大讯飞副总裁江涛曾在一次业绩说明会上透露,该芯片的能力已经基本做到可对标英伟达A100。
而据时代财经不完全统计,科大讯飞、百度、360、云从科技、智谱AI等多家科技企业已在使用该芯片。
事实上,AI芯片的算力比拼只是第一步,对于国产厂商而言,接下来的生态构建又是新的挑战。多位从业人士、分析师也一致认为,从配套生态、供应链等多个角度看,大模型厂商依旧难以彻底摆脱对英伟达GPU的依赖。
这不是一家国内厂商的难题。一位AI芯片设计相关的从业者向时代财经记者表示,英伟达于2006年发布的CUDA平台早已成为应用最为广泛的AI开发生态系统,这导致开发者难以脱离英伟达芯片,进行生成式AI的研发以及训练。
“从这个维度看,几乎没有芯片公司可以撼动英伟达的统治地位。”上述从业者说。
还有上市AI企业高管向时代财经记者透露,目前,国产芯片价格基本与英伟达产品一致,且产能出货也难达预期。“只有成为生态合作伙伴,才能勉强保证供应。”
“只要渐进就是一个好的趋势”
对国内大模型厂商而言,增加国产AI芯片比重仍是必然之举。
“保供已经成为一项关键的问题。一方面,美国很有可能会采取各种手段保证自身在人工智能领域的优势;另一方面,全球局势也可能会影响供应链的稳定。基于这样的预期,市场需要尽早寻得新的方案,这将成为国产AI芯片发展的机会。”陈巍认为。
为抓住这一机会,一众国产AI芯片厂商都在重点发力,拓展市场。据寒武纪向时代财经记者提供的资料,旗下思元芯片近期接连宣布与百川智能、智象未来等厂商旗下大模型完成全面适配。
“生态构建是目标,芯片只是基础,更重要的是在芯片之上构建函括架构平台、软件工具、操作系统和应用场景等一系列生态体系。英伟达起步早,国产厂商需要快速追赶。”吴全向时代财经记者分析道。
国际数据公司(IDC)披露数据显示,2023年上半年,中国加速芯片的市场规模超过50万张。在陈巍看来,这是一个能够让那个国产市场份额拉升的机会。“只要渐进就是一个好的趋势。AI芯片要在实际应用中才能够发现问题、加快迭代。我们一般认为,市场份额占比超过15%之后,生态建设才能真正跑起来。”
吴全形象地将国产AI芯片的发展比喻为树木的成长,“目前我们只是种下了一颗小小的树苗,完成了最基本的培育工作。国内企业仍需在技术创新、人才培养、产业链完善等方面付出更多努力。”