智东西(公众号:zhidxcom)
作者 | 李水青
编辑 | 心缘
2023 年,国内 AI 企业纷纷患上 ” 算力饥渴症 “。从互联网大厂到生成式 AI 新秀,在推出首款大模型后,算力成为提高产品竞争力的核心资源。
尽管云巨头相继推出令人眼馋的大模型训推 ” 全家桶 “,但实际可用的算力仍是稀缺资源。百模大战空前激烈,快速迭代刻不容缓,大模型企业们必须在格局稳定前占领市场的前排。
就在过去半年,百川智能、MiniMax、深言科技,这三家知名的国内大模型初创公司,纷纷投向了一家算力新贵的怀抱。
这家算力新贵是英博数科,成立刚满 18 个月,身上却贴满了标签。
它是 ” 彩票大王 ” 鸿博股份的全资子公司,踩着英伟达 GPU 算力红利的顺风,扛起了母公司转型的希望,带动鸿博股份股价在 2023 年最高飙涨 580%,一扫连跌六年的阴霾;又因为与英伟达的合作关系引发种种遐想,曾招致深交所数份关注函的 ” 灵魂发问 “。
▲鸿博股份一年以来的市值变化(图源:百度股市通)
它拿下了国内最大资金规模的算力服务协议:10 月,与北京京能签订共建超大型智算中心的合同,总金额近 10 亿元;12 月,与大模型公司百川智能签订近 14 亿元算力大单,同月公布与多模态大模型公司 MiniMax近 3 亿元的合同。
神秘、跨界、炒作、妖股……各种传言长期聚拢在英博数科的周遭,但随着一个个大模型算力订单公布,质疑声逐渐消散,取而代之的是对其商业模式的关注:
从籍籍无名到算力黑马,从摸着石头过河到连签过亿订单,一家没有算力背景的年轻公司,如何拿到稀缺的英伟达算力资源?又凭什么从云大厂 ” 虎口夺食 “,获得了国内头部大模型创企们的青睐?作为传统行业转型算力租赁的典例之一,鸿博股份和英博数科代表了怎样的产业真相?
近日,智东西独家对话鸿博股份副总裁、英博数科 CEO 周韡韡,揭开十亿级大模型算力订单与算力租赁商业模式背后的思考。
▲英博数科定制版 GPU 服务器(图源:英博数科)
一、一炮而红的算力黑马
传统大厂跨界做算力,在过去一年已经不稀奇。
在国外,美国加密货币挖矿商 CoreWeave 成为年度最火 ” 算力黑马 ” 之一,凭借转型兜售 GPU 云服务,以数万块 GPU 芯片狂揽数十亿美元的算力大单,全年营收预估暴涨 1567%。
在国内,受益于如火如荼开展的 ” 百模大战 “,多个算力概念股被热潮带飞,股价连涨一年。” 彩票大王 ” 鸿博股份、” 味精大王 ” 莲花健康、舷外机龙头恒润股份、游戏大厂世纪华通……都踏上了买卡、建智算中心、出租 GPU 算力的道路。
▲鸿博股份、莲花健康等一年以来的股价变化(图源:腾讯自选股)
相关智算基建布局在 2023 年下半年集中爆发。千 P 级智算中心建设计划、数亿到 10 亿元的 GPU 服务器采购及算力租赁订单比比皆是。狂热的 GPU 算力烈焰一路烧到 2024 开年。仅是在 1 月 3 日 ~4 日两天,锦鸡股份、青云科技公布了三笔亿级 AI 算力出租大单,合计超过 12 亿元。
而在一众算力股中,最抢眼的当属互联网彩票龙头鸿博股份,其全资子公司英博数科已经拿下了几家大模型公司的算力订单。
包括百川智能、MiniMax、深言科技在内的大模型创企,潞晨科技、无问芯穹等明星大模型中间层技术服务商,以及中科朗克等细分垂直行业领军企业,都已经是英博数科的客户。
鸿博股份由尤玉仙、尤丽娟姐妹创办于 1999 年,2008 年 5 月凭借彩票印刷业务在深交所上市,成为 ” 互联网彩票第一股 “,上市首日收盘价 3.35 元 / 股。鸿博股份的股价在 2015 年最高涨到 30.16 元 / 股,也是在这一年,其主营业务受政策影响遭逢重挫,自此开始频频探索跨界转型。
这家互联网彩票印刷龙头的转型方向包括大数据、5G、RFID 智能标签、手游……但几度跨界都不顺利,自 2018 年起,其印刷业务营收连年下降,并处于亏损状态。到 2022 年 8 月终止跨界收购广州智能扫地机器人研发商科语机器人时,鸿博股份的股价已跌至 7.92 元 / 股。
▲鸿博股份 2022 年的股价变化(图源:腾讯自选股)
当外界为它的再度转型失败而唏嘘时,鸿博股份又马不停蹄地一脚迈进算力赛道。
2022 年 4 月,鸿博科技跟英伟达签订采购协议,非常爽快得买了 20 台 A100 DGX;6 月 1 日,鸿博股份投资 1000 万元设立英博数科;2 个月后,由英博数科运营的北京 · AI 创新赋能中心项目落地,鸿博股份正式进入 AI 算力租赁业务板块。
这一次,鸿博股份赌赢了。
这个前瞻性的选择,让鸿博股份开启了 ” 算力黑马 ” 模式的新副本,并在半年后吃上了 AIGC 算力供需失衡的红利,股价冲天,身价暴涨。
二、连拿大模型算力大单,累计签约额超 18 亿元
过去大半年,百川智能创始人兼 CEO 王小川没少为算力各处奔走。
由前搜狗 CEO 王小川与前搜狗 COO 茹立云创办的百川智能成立于 2023 年 4 月,自 6 月起以几乎每月一次的速度高频迭代其模型,已经挺进国内大模型创企第一梯队,对算力的需求可谓饥渴。
在 8 月举行的百川智能沟通会上,王小川透露称已有阿里云、腾讯云、火山引擎、浪潮、顺丰科技等超过 150 家合作伙伴使用 Baichuan 模型,百川智能在同时使用阿里、腾讯的云服务。
▲王小川在讲解 Baichuan2 大模型能力升级点
10 月,王小川在云栖大会上作为大模型企业代表,透露了阿里云支撑百川智能完成千卡大模型训练任务;没多久,百川智能又为腾讯云背书,联合腾讯云向量数据库搭建基于用户知识库的智能问答演示系统。而后,阿里、腾讯、小米等这科技巨头都参与了百川智能的 3 亿美元 A1 融资。
在接受媒体采访时,王小川曾谈道,大模型行业训练和推理算力的合计成本占大模型总成本的 40% 以上。这道出了大模型创企普遍面临的资源压力:在首轮排位赛角逐出胜负之前,大模型训练对算力的渴求没有止境。
就当大家还在观望哪家云巨头能拿下更多大模型订单时,12 月初,一纸围绕百川智能的云服务协议公告,将业界的视线聚拢到了一家名不见经传的 ” 小公司 ” 英博数科身上。
根据鸿博股份 12 月 5 日公布的交易合同内容,英博数科将分别在不晚于 2024 年 1 月 30 日、4 月 30 日前分两批交付协议约定的英伟达 DGX/HGX H 系列智算服务器,涉及总金额 13.82 亿元。
▲合同公告截图
同月,AI 多模态大模型公司 MiniMax 也与英博数科就 GPU 算力租用达成签约,合同总金额接近 3 亿元,包括多款 GPU 的租赁使用等。
往前看,10 月,英博数科与北京京能签署了近 10 亿元合同,由北京京能作为主要出资主体,双方共建超大型智算中心。
在更早的 6 月份,英博数科与大模型创企深言科技签约,将提供不低于 1280P 的算力。此时英博数科累计签约合同额超过 2 亿元,已完成 5120P AI 算力租用服务协议的订单签约。
来自国内大模型 ” 顶流 ” 创企们的背书,给英博数科的履约能力、库中和途中 GPU 存量保证带来了真金白银的认证,也意味着英博数科已经站上了大模型算力造富运动的前锋。
三、大模型订单的秘诀:算力为王
为什么是英博数科?很多人对此感到好奇。
成立不满 17 个月、团队超过 50 人、背靠几度转型失败的 ” 彩票大王 “,英博数科的手里似乎并没有特别亮眼的王牌。
可就是这样一家小公司,在激烈的云服务与算力租赁竞争中,接连拿到头部大模型创企的订单,独享了 ” 泼天的富贵 “。
鸿博股份副总裁、英博数科 CEO 周韡韡给出的答案很简单:有算力。
2023 年,英博数科先是在 2 月交付了首个 DGX A800 算力集群,6 月 H800 陆续到货,8 月完成 1000P 由 A&H 系列智算服务器组成的 AI 算力集群部署调优,10 月累计交付 3000P AI 算力,能向客户交付相当规模的 GPU 算力资源。
据艾瑞咨询统计,大模型占据 2023 年中国智能算力总需求的 58.8%,是最大需求方。
▲大模型占据 2023 年中国智能算力最大需求
当美国政府的一纸限令叫停了英伟达对华高性能 GPU 芯片的供应,当云巨头对外可供训练的算力资源告急,拥有完整 DGX 交付能力的英博数科 ” 备胎转正 “,顺其自然成为大模型企业的首选。
毕竟在算力生意里,有卡就是王。
据周韡韡分享,在国内,大集群的稀缺性带来溢价收入,128 台机器的集群,每台设备单价会高于同级别客户使用 32 台集群的单价租金。
此前鸿博股份曾在互动平台披露,截至 2023 年 9 月,英博数科仅对外提供服务器整机包月一种租赁方式,A 系列服务器刊例价为 16 万元 / 月 / 台,H 系列服务器刊例价为 29.9 万元 / 月 / 台。
▲英博数科运维人员调试机器(图源:英博数科)
四、从元宇宙到 AIGC 基建,” 彩票大王 ” 跨界 AI 算力的起点
鸿博股份能够实现跨界转型逆风翻盘,离不开促成 DGX 合作的关键人物周韡韡。
她曾是媒体人,拥有澳大利亚阿德莱德大学金融学学士、悉尼大学传播学硕士、国际政治经济关系博士学位,曾任澳视传媒执行董事、澳中文化友好交流协会秘书长及 36 氪副总裁。
2014 年刚回国时,她一边学习正处于国内风口的互联网 +,一边利用以往累积的财经、科技信息做早期阶段项目的投后跟进,这其中有互联网彩票、游戏、DSP 流量平台等,也有后来知名的商用无人驾驶公司图森未来,这些项目基本都在 5 年内完成独立 IPO 或并购成功退出。
▲鸿博股份副总裁、英博数科 CEO 周韡韡
2017 年 8 月,图森未来宣布完成数千万美元 B 轮融资。当英伟达赫然出现在投资方之列,图森未来的一众技术大牛们狂喜。正是从他们口中,周韡韡明确感受到科技从业者们对英伟达的认可。
命运的齿轮开始转动。大约在三年前,判断元宇宙必将成为未来生产生活方式后,周韡韡萌生了承接算力基建的念头。她相信现有进程与真正的元宇宙之间还差一个通用人工智能(AGI),而 AGI 必然会开启一波新的基建潮。
在她看来,这个基建具有强刚需、高粘性、少 SKU 的特点,值得一干,而英伟达几乎是提供算力硬件的最佳选择。
从 2021 年底开始,周韡韡带着团队进行智算行业调研,并集海内外多方力量、资源、团队为算力储备努力,目标就是打造北京智算中心样板,然后在全国推广复制。
一直到 2022 年 8 月,鸿博股份等多方共同发起北京 · AI 创新赋能中心,由英博数科作为唯一指定运营主体,推进算力出租、云资源采购一站式服务、AI 教育培训、产业实验室等主要业务。
此时生成式 AI 方兴未艾,AI 文生图应用现象级走红,但 ” 大模型 ” 概念尚未出圈。在英博数科成立 3 个月后,AI 领域的里程碑产品 ChatGPT 才惊世出场,在整个科技行业掀起一股堪称改朝换代的创新狂澜。周韡韡的关注重心也随之转向通往元宇宙的中间工具—— AIGC(AI 内容生成)。
2023 年,AI 行业迎来了新燃点。大模型与 AIGC 热潮,将英伟达推上万亿美元市值的王座,也给许多亟待转型的传统企业们送来了前所未有的机遇:大量的英伟达 GPU 设备采购协议铺天盖地,”AI 算力 ” 几乎成了提振股民热情的永动机。
但困难也接踵而至。产品涨价、竞对降价、设备禁售……一道道难关开始摆在英博数科的眼前。
五、提前囤够 14 个月算力储备,与客户协作调优大模型训练
从启动开始,英博数科就在摸着石头过河,走一条前方无从参考的路。
2023 年 2 月,智算中心一期所有设备及配套软件全部到货,共有 100P 算力的 DGX 标准单元 SuperPOD 集群开始组网调优。此时周韡韡发现,能租得起、用得上庞大 DGX 算力的客户,只有大模型企业。
在英博数科成立初期,周韡韡跟王小川就 AI 发展前景和基础设施建设需求进行讨论。在王小川的建议下,英博数科在第一阶段确立了 ” 专业多模态大模型 AI 算力服务平台 ” 的定位,并将核心任务锁定在一件事上——买货。
针对大模型训练需求,一期智算中心的 DGX 系列服务器由原计划的 40G 版本升级为 80G 版本。当其它企业还在观望时,英博数科 2 月向原厂商完成了远超现阶段业务需求的算力设备订单锁定,随后其第一批设备赶上了美国对华芯片限令,团队立即将计划提速,在 6 月 30 日前完成了未来 14 个月的算力需求订单储备。
基于这些先手,当 10 月美国调整对华贸易政策致使许多高性能 AI 算力芯片贸易受阻时,英博数科正面回复:美对华芯片贸易政策对已经交付和系统内已存在的订单交付没有影响。
▲英博数科团队日夜兼程部署智算基地(图源:英博数科)
到货只是第一步,英博数科接下来要应对的挑战,是如何通过集群优化和软硬协同调优,真正支撑起大模型训练的高效运转。
周韡韡记得,从第一个由 20 台 DGX 服务器(160 张 GPU)组成的 100P 算力集群开始,客户与英博数科一手一脚共同搭建并调试出超越原厂标准参数的训练效率,用高性价比的国产通讯设备跑出了与昂贵进口设备基本持平的效果。
百川智能在 4 月成立之初就跟英博数科签署了未来 12 个月的英伟达 GPU 算力租赁服务合同,是英博数科智算中心测试期的合作伙伴和顾问,也是其智算中心 5 月正式运营后的第一个签约付费客户,英博数科由此开始产生营收。
在英博数科技术团队尚处于组建的阶段,百川智能的技术骨干为英博数科智算平台提供了从短期服务定位到长期发展目标、集群优化、极限峰值压力测试等一系列的沟通建议,以及对智算集群极限压力测试所使用的大模型。
由此积累的集群优化与模型发展相结合的调优加速能力,也成为了英博数科构建差异化竞争力、加速获客的优势所在。
从 6 月底开始,H800 服务器批量到货并进行了首轮单机对比测试。英博数科团队公开了大语言模型实际测试数据,希望能够帮助客户结合自身发展阶段做出更具性价比的参考。
▲英博数科 7 月公布的大模型单机比对测试数据(图源:英博数科)
但算力租赁赛道已经相当拥挤,也没有什么高技术壁垒,美国对华限令不见松动,凭借硬件设备储备的优势来营生终归不是长久之计。
英博数科开始提出新的定位:AGI 全栈服务商。
六、跟英伟达学生态,转型做中国版 App Store+Hugging Face
在英博数科第一个算力集群交付的时候,周韡韡曾被问过一个尖锐的问题:” 如果有一天,英博数科失去了设备原厂支持,甚至失去了硬件优势,之后该怎么生存?”
她很清楚,鸿博股份是传统企业出身,做技术研发拼不过互联网大厂,所以英博数科要做 ” 窄、小、深、沉 ” 的事:
窄,是大厂不稀罕做的细分领域;小,是一个小团队能够把它跑起来;深,是行业隐形护城河要深;沉,是足够下沉,行业覆盖的足够广,必须是个未来 5-10 年有发展空间的朝阳产业。
以算力出租服务为例,看似生意逻辑简单,怎么以便宜的价格拿货、怎么找到客户……这些隐形护城河其实很高。
但单一的算力出租业务不是长久的生存法则。周韡韡意识到,大模型、AI 应用接入几乎所有产业的生产加速是必然的,随着对高端算力需求的规模持续增长,这个赛道需要一个能够解决从基建到商业化落地问题的一站式服务平台。
因此,英博数科将自身定位升级为:AGI 全栈服务商,要形成中国版的 App Store(应用商店)+Hugging Face(开源开发者和模型社区)。
▲英博数科将提供 AGI 全栈服务平台
建生态,是周韡韡跟英伟达学到的重要一课。大模型企业基本上都会用 Hugging Face、GitHub 去研究和发现问题,周韡韡认为,将这些人汇聚到一起,会自然而然形成一个交流社区,这是英博数科向全生态链过渡的中间阶段。
英博数科研发的 GPU 云管平台搏博云(Bob Cloud,Best of the Best Cloud)由此成为核心,旨在实现跨平台 GPU 算力管理、统筹、调度及整合,实现 GPU 算力、数据化产品共享。
在周韡韡看来,有更多人愿意加入你的平台,通过你的平台去赚钱,这样才能良性循环起来,形成生态。
在搏博云中,APP Store 提供基于多模态大模型的多款应用体验版及 Pro 版;Tools Store 提供 ETL 自助式数据清洗工具以及无问芯穹、潞晨科技等合作伙伴的 PaaS 训练加速部署服务。
此外,还有数据商店提供用于垂类场景模型训练的数据产品;模型商店能方便客户下载各类合规的基础与训练大模型,用于自研、定制化开发。
由于英博数科不提供单纯的算力设备贸易销售,智算中心采用与合作方共建、交付后英博数科代运维管理的模式,所以所有英博数科参与的智算中心均会安装搏博云云管系统。
除了算力大单收入外,英博数科计划从搏博云各类商店产生的开发者分成、GPU 云服务、梧桐计划、MM 豆计划、产业聚合、开发者生态大赛、金融服务、AI 通识教育推广、股权投资收益等方面扩张其商业化体系版图。
” 这些就是英博数科的生存之道和应对之策。” 周韡韡预估,在完成这些板块升级后,英博数科有望实现 2 倍于现有签约数据的增值收益。
结语:大模型时代的算力淘金者们,谁能经得起时间的考验?
回顾 2023 年,在 ” 百模大战 ” 狂潮之中,算力成为躺赚的生意,一批传统行业龙头摇身一变成为热门的 ” 算力概念股 “。经过一年的大浪淘沙,谁在盛名之下其实难副?谁是真枪实剑披挂上阵?时间已经给出阶段性的答案。
有玩家已经败下阵来。如恒润股份,因高喊规划万 P 算力而风光了大半年,然而 2023 年 12 月其董事长因涉内幕交易被刑拘,致使股价 ” 一夜回到解放前 “,跌回了 2023 年开年时的水平。
▲恒润股份近一年来的股价走势(图源:腾讯自选股)
也有些玩家还在路上。比如 CoreWeave 和英博数科,找到了云计算巨头与芯片巨头合作的裂缝,成为 AI 时代向掘金者们卖铲子的人。
但算力服务会是一条能够经过时间检验的转型之路吗?一边是市场竞争暗潮汹涌,另一边是进口芯片难以维系,相比位于美国本土、邻近英伟达货仓、不受美国出口限令约束的 CoreWeave,日趋紧张的算力存货导致部分供应无法按期,已是困住一众国内算力供应商们的 ” 紧箍咒 “。
2024 年 1 月 3 日,青云科技宣布原协议约定 GPU 服务器无法按期交付,其销售合同从原总价款 6.9 亿元减少为 1.4 亿元;1 月 9 日,锦鸡实业发公告称美国限制令升级对原合同 3.12 亿元 AI 服务器的交付产生影响,深湾科技退还部分预付款。
轰轰烈烈的算力竞赛才刚开始。进入 2024 年,AI 算力短缺的情况预计会进一步加剧,但 ” 算力黑马 ” 们仍需解决很多不稳定不可控的因素,一旦产业风口变换、算力需求放缓,它们还能否顶住压力,在算力基建路上继续坚持?
即便是在大模型算力订单竞争领先一步的英博数科,前路亦需克服许多变化与挑战,在公布了 AGI 全栈服务商的新定位后,其商业版图的叙事更加宏大,要交出好的答卷也变得更难。
查看原文