这是研究人员对OpenAI训模型耗水量调查后给出的结果。
此外,据微软最新环境报告,2021年到2022年其全球用水量飙升34%,也就是近17亿加仑。
单看数字可能不够直观。这么说吧,17亿加仑约64亿升,奥运会标准比赛游泳池容量大概是250万升。
算下来顶2560个游泳池的用水量。
消耗的水自然不是被搬运走搞“ChatGPT山泉”去了。
而是为其背后拥有超大算力的数据中心散热。
靠喝水冷却服务器
GPT-4的诞生地就在美国爱荷华州的“AI超级计算数据中心”。
该数据中心在2020年首次亮相,是微软专为OpenAI提供的“训练场”。
这里面最为引人注目的当属驱动系统运行所用的285000多个AMD InfiniBand CPU和10000多个GPU。
如此庞大的算力自然要消耗大量的电,与此同时会释放出大量的热。为了保持环境凉爽,数据中心就要抽水冷却服务器。
该数据中心所处的得梅因是得梅因河和雷科恩河的交汇点,正好为散热提供了水源。
而用于散热的水量只能说很惊人。
据美联社消息,加州大学研究员Shaolei Ren一直在关注ChatGPT等AIGC产品对环境的影响,他将在今年晚些时候发表一篇论文,在其中会指出:
每问ChatGPT 5-50个问题,就要消耗约500毫升的水。
这个数字也包含为数据中心供电的发电厂所用的冷却水等间接用水量。具体提问问题的数量还要取决于服务器的位置以及季节。
正如上面提到的,微软也已承认用水也是训模型的一大成本,从2021年到2022年,其全球用水量飙升了34%,相比研究AIGC前急剧增加。
但同时研究人员还表示,情况可能还不算太糟糕——
数据中心位于爱荷华州,当地一年四季大部分时间气温还是较为凉爽的。只有气温达到29.3摄氏度或更高时,才会从自来水系统中获取水资源散热。
谷歌在爱荷华州也很渴
其他训大模型的科技公司同样用水量巨大。
前段时间,谷歌也发布了环境报告,去年一年喝掉了近56亿加仑(约212亿升)水。
相当于37个高尔夫球场的用水量,能抵半个西湖的那种。
并且当中52亿加仑(约197亿升)都耗在了数据中心散热上,同期用水量增长20%。
值得一提的是,谷歌在俄勒冈州的用水量近年来一直受到监管机构的审查,并没有大幅增加,但是它在拉斯维加斯附近的数据中心用水量翻了一番,而谷歌的爱荷华州数据中心是所有中最渴、用水量最多的。
那……没啥其它办法散热了吗?
有的。可白嫖的办法就是哪凉快哪待着,Facebook2013年就把一个热气腾腾的数据中心放到了瑞典北部,离北极圈仅一步之遥。
之前也有用空调系统的,但这种方法需要用大量电给冷凝剂降温,因电费贵等逐步被淘汰。
相对于电来说,水普遍便宜,所以水冷散热就流行起来了。但看现在这架势,这水是越喝越渴了。
此外,数据中心释放的这些热量易提取、稳定性高,还常年不间断,回收利用也是个节能的好方法。
现在国内一些数据中心已经用上热回收技术了。夏季回收的热量可以用来搞民用热水,冬季可以搞民用采暖,采用此方案还会减少制冷系统部分运行费用。
例如中国移动哈尔滨数据中心就采用高温水源热泵将园区机房设备产生的余热重复用于办公取暖。阿里巴巴千岛湖数据中心、腾讯天津数据中心、中国电信重庆云计算基地、万国数据北京三号数据中心等也都在回收利用余热。
高校也是算力一大集中地,上海交通大学在李政道研究所的科学计算中心堪称国内高校算力排名第一。
△上海交大实验楼球体区域
上海交大利用温水冷技术提升能源利用效率,50°C温水经温水散热系统出水温度有60°C。
余热也没有浪费,冬天用于实验楼中间球体连接区域的供暖,平时用来给食堂厨房的热水加热、地下室除湿,以及拓扑量子和时间投影两个实验室的空调温控。
目前,还有一些使用热电材料,将“废热”转化为电能的方法也在研究中。