查看原文
其他

云创远景:AI 如何让数据中心再降 15% 能耗?| Founder 100

Founder 100 Founder Park 2023-03-21

科技公司们为了给数据中心节能和散热,想尽了各种办法:将数据中心放在海底、北极;选择水冷、液冷的散热方式,而在当下全球都在朝着「碳中和」的背景下,如何降低耗能提高效率,减少碳排放,更是成为了一个要解决的焦点问题。

AI 能不能帮上忙?谷歌在 2016 年开发了一款降低数据中心能耗的 AI,国内的创业公司云创远景,也选择了类似的思路:利用 AI 和边缘计算技术,来优化数据中心、大型超市和写字楼的能耗。

在双碳政策(碳中和、碳达峰)之前,由于 AI「过程的可解释性很低」,不少客户对于最终结果有很多疑问。而在双碳政策后,尤其是拿下了英特尔的订单后,云创远景突然多了不少的商业客户。

为什么优先切入数据中心,云创远景创始人&CEO 沈骁是这么说的,「液冷或者自然冷源等更多地侧重于怎么用一度电产生更多能量,我们更多地在消费侧让它变得更有效率」,在原有的节能基础上,云创远景的方案可以再降低 15% 到 20%。并且,他们不是取代原有的能耗方案,而是能与之配合,持续优化,并且,占用更少的人力投入。

碳中和政策是如何影响能耗管理行业的?这个领域的技术壁垒是什么?除了数据中心,还有哪些行业可以切入?针对这些问题,我们和沈骁聊了聊,本次采访还邀请到了云创远景的投资方——变量资本管理合伙人吴江。


  1. 节能减排是国家对绿色能源的进一步推进以及对电驱动的产业扶持,碳中和在实际生产中更多体现在为了实现国家状态政策目标倒逼生产过程实现技术改造。

  2. 海内外的各种现实因素加速双碳政策由政策驱动变成市场或经济驱动的过程。

  3. 对于客户来说,一方面是降低了数据中心改善能耗对于人力的要求,另外就是提供了一个相对来说部署比较便捷的方式,更轻量化。

  4. AI 计算进行能耗管理的门槛体现在怎么用尽可能少的数据训练出比较准的模型,而不是传统的大模型数据学习。



01

双碳政策提升了

能耗管理行业的商业需求

Founder Park:双碳政策之前,你们的商业合作是怎样的状态?

沈骁:当时服务包括一些石油行业的客户和非常传统的集中供暖公司,拿到了他们在实际运行中的一些数据,发现在实际生产运行中,在温度的控制的链路上,其实有很多提升的空间。

一开始看到了在很多流程控制的生产过程中可以提升的点。当时给用户阐述我们可以提供一个质量更加好的控制系统,控制系统其中一项效果就是满足控制目标过程中的能量节省。

跟客户的沟通是比较坎坷的。总体来说我们是一个机器学习出身的团队,在现场,客户会有很多疑问,在行业的时间不久,怎么说明对线路的调整更有经验。技术是数据和机器学习驱动,控制结果让客户难以理解,控制过程的可解释性很低。毕竟直接采用完全自动化的建模预测控制手段的公司在行业里面很少。

Founder Park:双碳政策之后,对你们有什么影响?有什么典型合作案例?

沈骁:今年真实的商务订单的金额和规模有一个非常显著的提升。而且有这方面预算的客户分布也特别广泛。从运营商到国家部委到国内的大型企业,甚至还有一些海外的企业,我们看到了一个普适性的需求,这是感受比较强烈的一点。

标志性的案例是和英特尔的合作。去年 Q3 的时候,英特尔有意向采购一套系统,我们花了很长时间跟英特尔亚太乃至总部的相关部门去沟通。英特尔部署完之后,我们就感觉这是一个纯市场驱动的选择。英特尔对数据中心管理的要求是很严格的,不仅在中国地区需要做各方评审,还牵扯到亚太管理层级以至全球,我们经历了许多技术上的考验。

英特尔的辐射影响是很大的,一方面英特尔在国内覆盖的数据中心客户,是一些传统认知上采用新技术比较保守的国家部位,比如中国海关,另一方面是对海外非常直接的市场撬动。尤其是现在受俄乌战争影响以及新冠造成的供应链影响,海外电价飙升的程度比国内的要大得多,所以去年我们在市场的接受度上有一个转折点的提升。

Founder Park:从从业者的角度来看,节能减排和碳中和有哪些本质性的区别?双碳政策会带来哪些增量性的新要求促进行业发展?

沈骁:节能减排是国家对绿色能源的进一步推进以及对数字化驱动的产业扶持,碳中和在实际生产中更多体现在为了实现国家状态政策目标倒逼生产过程实现技术改造。一方面从管理手段入手,从生产过程中减少跑冒滴漏造成的浪费,另一方面用同样的能源或者原材料能够有更高的产出,提升单位能耗最后带来的价值。

很多能耗是管理的精细程度不当造成跑冒滴漏导致的,借用更多数字化的手段,能为企业提升生产效率。双碳政策不仅仅是一个简单的降低碳排放,还是更深层次的,是希望受政策影响的企业能够进一步提升本身的管理和技术水平。

Founder Park:双碳政策在市场里的驱动力能涨到多高?

沈骁:行业的采购往往会有行业标准。行业在配合国家的政策之后,会去定义例如绿色数据的平移标准,就会强调 AI 带来的能耗红利。另一边,行业标准会考虑在定义一个 AI 系统的时候,如何帮助现有的智能系统更好地工作等等。

一旦这些行业标准成立,后续会慢慢转变成一个市场行为,成为企业在做相关建设的一个标准,客户的行为也会转向纯经济角度的决策。

国内因为旱情比较严重,在东部地区面临拉闸限电;海外因为俄乌战争,发电成本高起,这些客观因素会加速双碳政策对行业或者客户由政策驱动变成市场或经济驱动的过程。


02

数据中心是能耗管理的

优先落地场景

Founder Park:为什么把数据中心作为第一优先级的落地场景?

沈骁:在住建部对建筑的能量密度划分里,数据中心是最高的一档,大致是 2000 焦,接下来是 5G 基站,包括一些药厂等等,一般的住宅建筑都是四五十焦,相差了两个数量级。数据中心在这方面的需求更迫切,因为它建筑面积不大,能量使用密度却特别高。

另一方面跟技术路线有关,因为是一套纯数据驱动和 AI 驱动的方法,数据中心辅助的客户主要是有大规模处理数据需求的,所以在这个行业中的客户对技术路线的认可和理解的速度会更快。同时数据中心本身的信息化和数字化水平比较高。无论从传感器的部署,还是从各个比较专业的子系统的搭配,都为落地创造了比较好的客观条件。

Founder Park:降低数据中心能耗的手段是多元的,你们看到了哪些机会?

沈骁:新建的数据中心会更加激进地去采用新的制冷方式,同时在位置的选择上会比较注意自然冷却利用。

另一边,选择电力供给是廉价或者偏绿色的。比如说现在东数西算的政策,很多在西部的数据中心,是利用风电或者光伏发电。通过控制的方式把能耗降低,适用范围是比较广的。

无论是利用自然冷源,或者利用廉价的电力或者绿色的电力,数据中心的控制还是比较传统的返回控制。拿 Google 举例,PUE*已经是 1.1,仍然有高达 40% 的空间降到 1.06。Google 能做到 40%,是因为数据中心是完全自主控制的。从我们的案例看,即使数据中心已经特别先进,PUE 已经是 1.1 左右,仍然能看到 20% 左右的进一步降低空间。

PUE:Power Usage Effectiveness,电能使用效率,PUE = 数据中心总设备能耗/IT 设备能耗,基准是 2, 越接近 1 表明能效水平越好。

Facebook 在北极的数据中心 | 来源:互联网

除了新建数据中心之外,更加广阔的是存量的数据中心,因为数据中心已经经历了十年的高速发展,十年前的数据中心,把智能部件全部更换,是一个投资巨大的事情。在这基础上它也会需要相对来说投资比较小,但是有立竿见影的效果,这也比较适合我们的方式。

液冷或者自然冷源等更多地侧重于怎么用一度电产生更多能量,我们更多地在消费侧让它变得更有效率,可以很好地跟供给侧更有效率地配合。带来的红利是由于控制本身机制的改变,从理论的角度说,它有 10%-15% 的提升空间,结合管理,能看到这个技术路线是有一个比较稳定的火力的。

吴江:实际上国内的数据中心新兴建设很早,在规划的时候就已经开始考虑能源供给,比如整个自然环境是否足够作为降温系统等类似问题。云创远景的系统优势在于不管是否安装类似的系统,是否放在一个本身质量环境比较好的地方,依然有机会帮客户做出一些调整。自然环境和外部环境是先天状态,云创远景能够在后天状态帮助做算法优化,做供给设置,做优化调节,得到的结果是在原有的环境下再下降 15% 到 20%,这是一个比较重要的指标。

Founder Park:你们目前的需求核心更多来自存量数据中心还是新建数据中心?

沈骁:从今年开始新订单里新建数据中心的比例在逐渐提升。这可能主要得益于三大运营商前两年在数据中心建设和绿色数据中心评级标准做的工作。他们在过去大范围内各类能耗优化方案的试点中,也看到这个技术带来的潜力。

无论是一些民营 IDC 或者说一些数据中心运营商主导建设的数据中心里面,能明确看到在评定标准中开始引入对于 AI 技术的发挥程度,成为绿色数据中心如何分配其中一项指标。

Founder Park:数据中心的能耗分布是怎样的?哪个环节需要被核心降低?

沈骁:一般我们常见的分布,PUE 会在 1.5 左右,大概 60% 多一点的电用在 IT 负载,将近 40% 的电用在智能方面。

我们更加侧重于 IT 设备的负载,让它变得更有效率。其实是有很多基础的,包括和英特尔合作尝试用 AI 手段做 IT 设备的主动降频。但相对来说能被广泛接受,并且比较成熟的还是聚焦在制冷系统的进一步优化上。


03

不是取代传统能耗管理,

而是在此基础上继续优化

Founder Park:你们和传统的楼宇能耗管理公司的不同在哪里?

沈骁:能耗优化和技改的服务商大致分为两类,一类偏重服务,传统的基于反馈的控制链路应该跟随着不同的建筑类型和工况进行调整。专业点说,在不同的环境下它都有最优的 PID 参数设置。客户买来装备后基本上默认出厂参数就行,很少继续调整。

有一类友商,对装备的机理了解透彻,暖通知识储备比较丰富。同时有些基于合格模型的的基理库,在原有的访问控制基础上针对不同环境做调整,市面上非常多的公司主要路线都是这样。另外一类公司就是像国际巨头江森自控、霍尼韦尔,在现场总是需要一些控制核心,根据环境情况去控制冷机或者管线的工况,他们在控制基础上有一个比较完善的软件栈。

我们的定位更像江森自控和霍尼韦尔,产品和方案是在控制核心层面上,主要是建模预测控制,所以在现场人工调参比重是非常非常小的。基本上是一个高度标准化自动化的方式。在现场需要的做的事情是和传感器对接,需要在模型训练上进行监管,包括对最后优化控制的前期进行监管。事实上我们很多客户是楼宇或者做数据中心能耗优化服务的公司,他们拿着控制核心和相关的工具链,在现场做更加完整的交托,这是我们和市面上很多做节能服务厂商的核心区别。

吴江:云创远景本质上和做建筑能耗管理的公司没有实质性的冲突,无非是技术路径切入手段和场景的普适性不太一样。现在很多做能耗管理的服务公司把云创远景的服务打包到一起,完整交互给客户一个相对整体的解决方案,这是可以并行的,有极强兼容性的特性。通过这个特性,不需要去改别人原来的系统,直接在系统上做一些辅助,然后再做一些调整,就能把原本的能耗降下来。

Founder Park:数据中心对于你们的系统,关注的核心点是?

沈骁:作为数据中心的业主方,首先他们关心能否在现有的容量拥有更多的机会,更多机会意味着更多收入,在这前提下可能会面临一些挑战:

一方面是数据中心的电力供给有时候是有配额的,有些超大型数据中心,一个就占了整个区域供电的 40%,就需要考虑如果要保证机会每年稳定增长,如何在这基础上更有效地优化电力?数据中心每年都会有些预算用于制冷装备的实际改造,这是最常见的;另一方面,聘请更专业的运维团队在数据中心进行更加精细化的管理,这种手段是有极限的,因为大型数据中心人员配备不可能到那种程度。

数据中心的硬件升级也是有尽头的,因为物理上的一些大的进步,总是有比较长的时间差。这里发挥的作用,就是让实际的 PUE 表现尽可能去贴近机器的理论 PUE。

从用户角度来说,我们对他们的价值在几方面,一方面是降低了数据中心改善能耗对于人力的要求,就不太需要现场运维团队具备丰富的经验,或者对系统本身的技术属性有深的认识。另外就是,我们提供了一个相对来说部署比较便捷的方式,只要接入到他们的控制网络就可以发挥作用。总的来说就是易用性和轻量化。

Founder Park:你们的解决方案可以给客户提供的核心价值是?

沈骁:首先客户可以享受到 AI 控制的实时性,我们能对数据中心全链路做到分钟级的实时控制。同时也留给数据中心人员一个接口,能够随时切断控制,立刻恢复到数据中心原有的控制逻辑。

从客户角度来说,相当于有一个 AI 电脑,在需要的时候可以介入,在不需要的时候可以随时断开。过去数据中心运维过程中也可以对参数进行调整,但是这个调整可能不如我们的方案。主要体现在两点,比如说把一个房间的温度从 20 多度降到 25 度,能量肯定是恒定的,这是客观规律,但是能量的使用上会有浪费,所以可能需要 1000 焦的能量,但实际上用了 1400 焦,怎么把它做得更准呢?首先要把数据中心内部的一个由物理系统决定的热负载算清楚,过去算得不准的主要原因是传统手段计算代价特别大,最终结果很难用在日常运维和实时控制里面。我们有一套基于物理感知的神经网络的技术,能够用比较少的数据进行精确的求解。

其次就是数据中心的部件比较多,链路也比较复杂,在这么复杂的链路下人为寻找优化方式是比较难的,我们设计了一个并行化的求解机制,能够在物理模型的基础上进行快速并行求解,目前已经可以做到 10 秒内对几千个参数进行求解。

Founder Park:你们的典型客户有哪些?

沈骁:我们的客户分为几类,一类是运营商,和运营商所属数据中心的数量有关系,接下来是一些国资背景,包括一些大型央企,还有一些国家部委,再一部分是混合企业。

当下来说运营商会多一点,但是就今年的情况,无论是国企还是跨国公司乃至一些海外客户,比例都在逐渐提升。


04

技术壁垒是使用

小数据训练准确模型

Founder Park:你们怎么定义自己的竞争壁垒?

沈骁:有几个维度,首先是技术方向,分为两步,第一步对现场的物理模型的近似,门槛体现在怎么用尽可能少的数据训练出比较准的模型,我们现在看到的以自然语言理解或者以视觉为代表的机器学习的技术,它的模型是很庞大的,因为需要学习的样本比较多,很多样本的一些特征在我们客户现场是很难有数据产生的。

从数据多样性来看,不可能无限制地去对客户现场的工况进行扰动,扰动会影响温湿度控制,碰线就会报警,相当于带着枷锁跳舞,这个枷锁是客户为了稳定生产确定的范围。

用特征的数据实现模型标准比较大的挑战是数据中心的功耗变化,一方面负载会变化,另一方面外界环境也会不断变化,还会有装备的更新,除此之外还得考虑到比如传感器损坏之类的空调状态的老化。这样就要求用比较小的数据量作为训练数据,同时保证一方面在当前的功况下比较准确,另一方面对设备长期由于物理特性的变化,同时具备有比较好的鲁棒性。这个技术上的挑战是和做自然语言理解或者做视觉是完全不一样的。

Founder Park:如果专门给数据中心做能耗管理的公司把 AI 能力提上来,会不会变成强竞争对手?

沈骁:技术壁垒在资本面前是其实很脆弱的。有一些公司已经是几百亿的营收,砸了几十亿专门做这个事情,确实是可以做下去,这是毫无疑问的。我们现在确实是在跟一些海外的自控公司在谈。在国内来说,我们成熟度会比他们高。

海外巨头会从投入产出比较去考量,会考虑入股或者并购等等各种方式。我们和他们竞争,但实际上还是会有非常多的合作。从他们的逻辑来看很简单,其他公司里肯定有超过他们的内部职业经理人,会有更多的激情和动力扑在上面,成熟速度有可能更快,而且成本会更低。那么在一个合适时间点进行投资,如果未来确实在这个技术上成为竞争对手,那其实是共享红利,再往前走还可以并购。对于公司发展来说,这些都是非常理性的。

对于国内相关的能耗服务公司,这个技术路线对于团队要求还是比较高的,要对自控领域和暖通物理的基础学习,包括对硬件的边缘计算估计要自己构建,需要一个综合能力要求比较高的团队。对于暖通服务领域成长的友商来说,构建团队是一个比较昂贵的事情,这给了我们一定的空间。

Founder Park:你们更愿意被别的公司集成还是愿意自己做集成?

沈骁:我觉得在今天对任何一个公司它都不是个 0 和 1 的问题,任何一家公司可能都会有被别人集成成分,也有可能集成别人的成分。从产业的视角来看,我们更多的是在做传统控制的升级,过去的控制体系是以 ARM 架构的 PLC*或者 DDC 为主,它的算力相对来说是比较受限的。这几年海外的自控巨头,包括西门子、德国倍福等,开始将很多高端控制场景迁移到 x86 架构。X86 架构在算力方面有更好的表现,尤其是有虚拟化方案,能让现场控制的装备从单一的专有硬件慢慢变成一个通用平台,这是能看到的整体趋势。

PLC:PLC、DDC 是两种不同的楼宇自控系统,PLC 为可编程逻辑控制器(Programmable Logic Controller);DDC 为直接数字控制 (Direct Digital Control)。

在国内高端控制领域里,可能完全是 x86 架构的建模预测控制。过去这个领域是海外厂商垄断,在国家政策导向下,过去风电的控制核心海外厂商是 100%,现在慢慢国内厂商至少是三分天下,包括我们合作的一些国内的控制厂商也吃到了红利。

回到集成或者被集成的关系来看。在今天的建筑领域,更多是希望能成为闭环。从一个数据中心或者大型楼宇的楼宇自控系统来看,暖通这部分我们是希望做完整交互的,从通讯 IO 的硬件到计算核心。今天我们已经是一个拥有超强算力的 x86 架构的硬件形态,包括上层的楼宇 BA 控制系统。事实上今天我们在数据中心已经基本覆盖了暖通自控里最核心的部分。从这个角度来说,我们是一个集成方,因为在这个过程中我们集成了国内自供厂商的一些控制模块和传感器的方案。

在其他行业也可能用到我们的技术,这是把底层技术平台化、工具化的机会。可能在其他行业更多的还是我们被集成,公司需要有所取舍,专注在几个能够树立比较高竞争门槛的行业,他们基于我们的产品和技术,打造一个完整业务闭环的系统交付给客户。

Founder Park:你们未来的布局方向?拓展逻辑是什么?

沈骁:目前从几个维度看,一个是数据中心和一些专业的楼宇,更多的解决方案是尽可能形成闭环,同时有两个延展点;一个是向产业链上游进一步延展,把算法小型化、轻量化,现在已经可以由一个半个名片大小的 RISC-V 芯片承载,芯片带有 AI 加速核心 TPU,RISC-V 的 TPU 大概是 1TFLOPS 算力。

我们现在也在跟一些装备厂商,包括一些国际大厂在谈前装。如果现场的装备能配备更好的算力,能够承载对环境建模以及最后对优化控制的求解。显然这个装备出厂就应该带有这种能力,出于这个目的,去年年底就开始有类似的产品原型,包括今年和运营商,以及和一些国际自控巨头开始有一些实质的合作。很重要一点是把我们在整体解决方案最后沉淀下来的技术小型化,轻量化,然后把它做到更多。

前装市场就是我们成为比如一些空调厂商,一些中央空调厂商,或者一些楼宇方案厂商他们的供应商,最后要在楼宇包括数据中心,形成普适性的碳中和。

在今天包括跟国内的一些工业或者电力行业控制的公司合作,再看是否可能把建模的技术工具化、平台化、在其他行业更多地由我们的合作伙伴来形成完整业务闭环交付,把预测建模控制的技术栈在其他行业也发挥同样的效果。所以大致是一横一纵延展的想法,希望未来能够慢慢实现。

*以上嘉宾观点不代表 Founder Park 立场,也不构成任何投资建议。


公司:云创远景

领域:能源环保、云计算、边缘计算

融资状态:A 轮

主要投资人:变量资本、中科创达

官方网站:http://www.quarkdata.cn/


创始人 & CEO,毕业于大连理工大学,计算机硕士学位。拥有多年的数据治理和机器学习从业经验,曾在微软带领团队利用机器学习技术改进必应的相关性。

云创远景自研了一套 AI 驱动的 DeepCooling 边缘控制系统,来优化数据中心、大型超市和写字楼的能耗。目前该方案已在中国电信、中国移动、中国联通及海关等政府部门落地应用。云创远景是 Intel 中国官方数据中心碳中和计算合作伙伴,之前获得了变量资本的投资,此外也是全球领先的云基础架构和移动商务解决方案厂商 VMware 在中国唯一投资初创企业。



更多科技创业者的采访,欢迎在
小宇宙或者苹果播客收听我们的播客节目「Founder 100」。
Founder 100 栏目一直在招募优秀的科技创业者来做客我们的直播间,如果大家对于这档栏目感兴趣,也有意向想要来分享自己的故事,欢迎大家长按下图,识别图中二维码,填写报名申请单。
更多阅读

转载原创文章请添加微信:geekparker

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存