引言:2009年9月23日,AMD率先发布了全球首款DX11显卡Radeon HD 5870,强悍的1600个流处理器使其一举登上当时单卡性能之巅,规格稍低的同门兄弟HD 5850也随之问世,与HD 5870双剑合并一同锻造出基于Cypress核心的HD 5800系列。不可否认,HD 5800系列不仅代表着DX11之门由此开启,更重要的是它在AMD抢占显卡市场的战略中扮演了极为重要的角色。那么在HD 5800成功与辉煌的背后又有怎样鲜为人知的研发历程与幕后故事呢?近日国外知名硬件媒体AnandTech撰文,为大家讲述了Cypress(RV870)由孕育到诞生的坎坷道路,我们在此将该文进行编辑整理,以供各位读者评赏。(原文链接如下:http://www.anandtech.com/video/showdoc.aspx?i=3740)
在去年大部分的时间里我对AMD公关的感情是爱恨参半的,不过到了年底,这种这种感情发生了明显的变化,我对他们已经爱多恨少了。话说2009年夏天的时候,我为AMD的一通电话等了好几周的时间。
我们都知道RV870将在那年年底之前发布,往往在新的硬件发布前一个月的时间我们就能见到新GPU。虽然有传言称其发布推迟了,但是我还是在6、7月份得到了电话通知,这来自于我的老朋友AMD公关Chris Hook。这一次,他希望我去参加在加利福尼亚沿岸的一艘船舶上举办的新闻发布会。
我并不是对在舰艇上举办发布会有什么不满,只是当时心中完全被RV770的下一代产品所占据。是RV770让我重拾了对ATI显卡的信心,但是我担心这并不会延续下去。AMD向管理层和合作伙伴承诺,这次举办的发布会一定不会让大家失望,我们可以直接采访工程师,获得想要的信息,当然,还有免费饮料。
我可不是凭免费饮料就能收买的人,不过Chris Hook很了解我,他知道我想要什么。
[2.2009年9月的新闻发布会]遗憾的是我必须要提前离开晚宴,因为华硕董事长施崇棠刚好也在奥克兰,而我在离开那里之前只有这一次机会去拜访他。只要我们在同一座城市,通常都会千方百计碰面一次,这次我也不想让他失望。
史蒂夫·乔布斯(Steve Jobs)之所以取得成功是因为他以产品为中心,管理者一个以产品著称的企业。施崇棠从骨子里来看是一个工程师,他的公司则以专业的工程设计而享誉全球。我和他的会面并不是去会见另一位公司主管,而是去拜访一位有着共同爱好的老友,他的兴趣并不全是挣钱,更多的是工程技术,这十分难得。
在离开宴会之前我同Carrell Killebrew(AMD图形产品规划总监)握手道别,他告诉我说:“不要把我写进故事里,这个芯片的诞生是成千上万位工程师辛勤努力的结果。”和施崇棠一样,Carrell Killebrew也有自己的特质使得他能在行业中脱颖而出,这是成功人士的共性。他们的经历使得他们融入了今天为之奋斗的企业,他们的一系列品质铸就了他们独特的个性。
Carrell Killebrew就是集智慧、务实、激情和谦恭于一身的一个人,他的信条是,你要相信别人可以做到最好,否则你永远无法见到最好的局面,这对于他人来说是积极的鼓励和充分的信任。Killebrew并没有参与RV870的研发,不过正是他确保了RV870的成功。
下面要讲述的就是Radeon HD 5800系列的GPU——RV870背后的故事,当然这只是很小的一部分,真正的故事历经了数年时间,是成千上万位工程师智慧的结晶。这款GPU和其它GPU(比如Fermi)一样是很多行业顶级工程师倾尽毕生心血的作品,接下来我会尽量将故事还原并呈现给大家。
在讲述GPU开发历程的时候,我们往往要回溯到几年前。介绍一款全新的GPU要从2至4年前说起,为了了解Radeon HD 5800系列(RV870),我们要从2005年说起。
[3.新GPU的命名]AMD并不喜欢媒体使用RV870这个名字,在新一代GPU的命名上,AMD希望可以摆脱陈规。根据AMD自己的说法,并没有叫做RV870的GPU(AMD称其为Cypress),尽管过去几年里Carrell Killebrew、Eric Demers等人一直这么称呼。由于变化太大,我们需要一些时间来消化。
AMD这样做有何意图?原因很简单,给GPU家族的每位成员以全新的命名可以混淆竞争对手。你很容易就能看出RV870是RV770的下一代产品,但是你很难想到Cypress和RV770有什么关系。
AMD公关人员也希望我能在文中使用Cypress而不是RV870,以下图表简单明了地介绍了AMD 40纳米DX11 GPU的全线产品及研发代号:
由于许多用户仍然习惯于RV870的叫法,接下来的文章中我仍然用RV870来称呼这款GPU,不过鉴于一些用户也接受了新的命名方式,我会穿插使用Cypress和RV870。整个这代芯片家族名为“Evergreen”,下一代称之为“Northern Islands”。
产品必备特性
ATI有一份被称之为《产品必备特性》(Product Requirement Specification,PRS)的文件,这是用Word编写的文本文档。
这份文档的目的是为正在设计的GPU汇总必须拥有的功能,并对这些功能的重要级别进行排序。优先级为1的功能是GPU必须要开发的功能,之后是第二级、第三级等。等级数越大,该功能在GPU中实现的可能性就越小。
在Carrell Killebrew刚刚加入ATI的时候,其领导(Dave Orton)将整编PRS文件的重任交给了他。Orton对他的要求是,修改后的PRS能让市场部门无法再找到任何失败的借口。Orton希望这份文档能让各方满意,不论是市场营销部门还是工程研发部门,从而都能尽心尽力地按照文件去执行各项工作。
尽管Carrell是在2003年加入ATI,但是直到2005年,PRS文档的内容才得以修订。
[4.R5xx系列对ATI的影响]ATI延期发布R520在整个产品线上引起了连锁反应,甚至影响到了R600。也就是在那段时期(2005年)ATI从根本上改变了其产品设计理念,决定以市场为导向。
市场会定期或是不定期地出现增长点,发布新产品最好选在那些时候。每年第四季度的购物季,或是DirectX、Windows重大版本发布时,都是市场出现快速增长的重要时间点,原始设备制造商的笔记本设计周期也很重要,你需要把握好这些时机调整产品的研发和发布。
ATI的Eric Demers(现任AMD图形部门首席技术官)清楚地认识到了这一点:如果你不在适当的时候迎接挑战,那么等待你的通常是失败。ATI转而以市场为导向也就意味着需要严格控制产品功能列表,也就是说,Killebrew必须进行大量的工作,重新起草PRS文件。
如此一来就有了“80%法则”,也就是说,凡是出现在RPS里的条目均是工程人员有至少八成把握可以按时完成的功能。这使得很多事情发生了变化。
首先,这提高了工程开发团队的信心和士气。其次,这有助于精简PRS文件,PRS文件列出200多项功能是很常见的,有了“80%法则”,PRS文件的功能列表实现了极大的瘦身,R5xx之后PRS文件的功能减少到了80个左右。
在此之前,ATI总是会考虑很多新功能和消费者需求,但是自R5xx之后事情发生了变化,如果一项功能会导致产品推迟发布,那么该功能不会被添加进PRS文件中。ATI现在的理念是任何芯片功能都不能影响产品发布。
[5.建造一个更大的RV870]虽然Radeon HD5800系列于去年9月份才发布,不过早在2006年ATI就开始讨论如何设计其GPU。到了2007年,关于Evergreen家族究竟是什么样,ATI已经拿出了一个粗略的方案。那时候ATI对DirectX 11和微软Windows 7的发布已经有所了解,只是不知道具体日期而已,不过ATI知道应该在什么时候之前做好准备,因为那将是另一个所谓的市场增长点。Evergreen必须在2009年第三季度前准备好,既然日期确定了,那么下一步就要开始讨论其功能了。
Carrell想要的是另一个RV770,他坚信自己之前提出的设计理念,他想要的是精巧而且价格合理的产品。问题是,当时还是2007年,ATI内部对一年后才发布的RV770也并不是十分自信。
市场营销部门不看好开发另一个RV770的思路。R600发布后没有获得良好的反响,ATI当时饱受来自各方的抨击。AMD刚刚收购ATI,CPU业务也在承受着极大的压力,必须有一个部门盈利才行。在GPU方面,市场部门不想将鸡蛋放到同一个篮子里,而且这种设计还不是行业最领先的。
在一个以速度为中心的市场里,公关部门很难回答“为什么你们的产品不是最快的”此类的问题。市场部门不想要另一个RV770,他们想要的是一个NVIDIA杀手。那时,没有人知道RV770是不是NVIDIA杀手,他们认为需要建造一个更大的芯片。
2007年8月到11月之间对Carrell来说是一段艰难的日子,他差点就放弃了。因为NVIDIA计划研发一个大的芯片,所以ATI也想要一个大的RV870,这惹恼了Carrell。一年之前,他为了不让RV770成为大芯片,据理力争,现在历史又重演了。
虽然如今我们都知道,小芯片的设计思路是可行的,但是ATI在当时做出的不再研发另一个RV770的决定也是很明智的。如果你已经经受着巨大的风险,那么再冒一次险就显得没有意义了。
Carrell并没有完全屈服,但是他也没有能力扭转乾坤。当时他只剩两条路可走,一是退出,二是闭嘴听任事态发展。
事态进展的结果类似于不完全妥协,最终的PRS文件并没有规定芯片大小,Carrell同意将RV870的性能设定为RV770的两倍。之所以称之为不完全妥协,是因为工程师认为这是为建造大芯片开了绿灯,他们计划研发一个20mm的芯片,或许还能提升至22mm。
[6.调整后的路线]Carrell对大芯片不感冒并不是因为这在研发制造的时候有难度,而是因为它会大大延长GPU由600美元高端向200美元主流产品的过渡,AMD相信最重要的市场是更大(数量和收益两方面来说)的性能级主流显卡市场。
Carrell决定先向200美元至300美元的性能主流市场推出新技术和工艺,然后再将产品升级或降级,分别提供给高端和低端市场。
RV770的风险在于架构和显存技术,而RV870的风险在于架构和制程,后者完全不在AMD的控制范围内。
早期Carrell就认为台积电的40nm工艺还不够成熟,就算是工艺准备好了,其生产成本也要比预期高出很多。那时Killebrew并没有在这一点上大做文章,只是告诉我说台积电40纳米工艺看上去很美,实则不然,这点在下文中还会谈到。
Carrell极不情愿地继续着制造一个大于400平方毫米(20mmX20mm)RV870的工作,因为他相信硬件工程师们会有清醒过来的一天,那时候他们会意识到造这样一个芯片并不便宜,届时就可以展开新的计划。
2008年2月份的时候,台积电开始放出风声,提醒ATI不要对40纳米工艺不要过于乐观。从台积电返回的ATI工程师表示,RV870的制造成本将会非常昂贵,并建议重新考虑芯片的架构。
于是,他们重新讨论了芯片架构问题。
团队再次碰头,却仍然无法摆脱Rick Bergman的“折中方案”:RV870的性能要达到RV770的2倍,但芯片面积必须降下来。ATI在2008年3月修改了Cypress(高端,单GPU RV870)的架构。
此时的ATI表现出了真实的一面,他们既不想延期发布日程,又不想放弃设计最大GPU芯片。为了后者,ATI牺牲了前者。
你要知道,如果在芯片发布前一年多的时候还在修改芯片的架构,这意味着事情会被搞砸。在RV770完成的时候,RV870本应该稳如磐石,任何修改都会打乱很多计划安排。现在ATI却必须回去重新设计芯片平面图并且修改架构,这至少得花几周的时间,或许几个月的时间。这就影响到RV870既定发售时间表。 ATI不得不努力地工作,以尽量减少对发售时间的影响。因为这个变故,Radeon HD 5870比原定计划大约晚了30至45天。
ATI并不是唯一一家知晓DX11/Windows 7发布日程的公司,NVIDA也很清楚这点。但是NVIDIA非常清楚孰轻孰重,因此宁愿错过这个市场增长点,也要对Fermi的种种新特性进行优先级排序。AMD冒着产品延期发布的风险是为了制造一个小点的芯片,而NVIDIA冒着产品延期发布的风险是为了制造一个大点的芯片,两家选择了不同的道路。
工程师们十分纠结,RV870要在尺寸缩小的同时提供两倍于RV770的计算能力,那么一些特性必须要砍掉。
[7.夭折的Sideport]能与Eric Demers和Carrell Killebrew共进晚餐是我接触ATI之后的最美好的体验之一,Eric在席间谈到他们是如何将RV870从400多平方毫米削减到了334平方毫米,我想知道更多的细节,因此询问他们是如何舍弃某些功能的。
厂商们一般不会谈及哪些东西时他们丢弃的,他们更喜欢谈论如今的产品中保留下来的功能。幸运的是,他们没有在这次晚餐中那样做。
Eric把脸转向Carrell说:“我想有一个特性我们可以说说,Sideport。”
Carrell回答说:“哦,这太不公平了” 。
当年ATI第一次谈及Radeon HD 4870 X2时,他们告诉我有一个叫做“Sideport”的功能,每个RV770图形处理器都可以借此进行GPU到GPU之间的通信。
当交火(CrossFire)任务以交替帧渲染模式(AFR)进行时,GPU之间无需通信,但是如果在需要进行同步渲染时,交火性能就会受到影响,“Sideport”就是用来解决这种性能下降问题的。
遗憾的是,由于功耗等原因,Sideport从未在4870 X2上得到使用。ATI公版设计中禁用了Sideport,其它厂商同样也禁用了这个功能。
Sideport是Carrell Killebrew最喜欢的一个功能,但他不得不舍弃。在2008年年初ATI一是到他们不得不将这个芯片的边长从20-22mm砍至18mm的时候,每个人都要做出一定的牺牲,而Carrell是此举的最大倡导者,因此不可能不放弃一些自己喜欢的功能。
我不能在文章里详尽地描述我和Carrell之间关于Sideport的谈话,它本应该在RV870里发挥作用的,只是现实很残酷。Carrell最后说,如果哪天我看到了Sideport,那也不要惊讶,你知道,Carrell从不轻言放弃。
[8. 6个月内发布的4款GPU]克服了以上种种困难,ATI将RV870尺寸削减为18mmX18mm。问题是,RV770边长只有16mm左右,RV870的尺寸仍然过大。
Carrell想对芯片面积再进行更多削减,但有两个方面改变了他的主意。首先,如果按照RV770尺寸来设计RV870,那么要牺牲的功能超出Carrell原先的预想太多,其中就包括牺牲部分着色核心。
另外,为了让GDDR5显存数据传输率达到既定目标,他们必须增加芯片上的模拟物理层面积。如果RV870还采用16mm边长,他们就不得不缩减显存带宽或者牺牲着色渲染核心面积,这两种方案都会让RV870的处理速度变慢。
我询问Carrell ,如果芯片的边长只有16mm,是否会让发布时的RV870价格调低100美元,达和RV770相同的水平?他否定了这种可能,但是直到很久以后我才搞明白为什么。
为了实现16mmX16mm的芯片面积而牺牲性能的事并没有发生,Carrell最终相信了“设计一个更大芯片是可行的”,究其原因,ATI有能力在不到6个月的时间内发布4款不同的40nm DirectX显示芯片。
ATI的工程团队承诺了两件事:第一,Cypress会有一个能同时准备就绪的后续产品“Juniper”。第二,Cypress发布之后,ATI还有2个图形处理器产品可以发布,整个新一代产品线将在不到6个月的时间内部署完毕。ATI曾在2008年近3个月的时间里发布了3款GPU产品,但HD4000系列的第4个成员直到2009年4月才发布。
这并不是不可能的,ATI在印度、中国有多个协同工作的设计团队,对Cypress和Juniper的设计工作一前一后的展开,假设研发工作中没有出现大的纰漏 ,ATI完全可以实现Juniper团队和Cypress团队的工作衔接,实现极高的研发效率,因为两者是基于相同的硬件(Juniper就想是Cypress的半身)。
Carrell认为这实在是太冒险,对于同一代的芯片而言,要并行设计两个GPU芯片的风险着实不小。如果一切顺利,你就会在同一时间得到两款产品。如果设计不顺利,两个团队就会被困在同一代产品上,产品的延期会让ATI不得不面临自己的“Fermi”。
不过工程团队告诉Carrell,他们能够实现这个目标。Carrell给予了他们充分的信赖忐忑地在方案上签了字,Evergreen家族就这样诞生了。
Cypress和Juniper几乎是同时交付的。实际上,Juniper比Cypress完成地还稍早一点,样卡在ATI发布HD5000系列几个月前就交到开发人员手里了。Cedar和Redwood也随后也顺利完成,双Cypress(Radeon HD 5970)就更没有悬念了。这一切都发生在短短不到6个月的时间内(芯片本身在4个月里就准备完毕了)。
当迷雾退散,ATI在400美元、300美元、200美元、150美元、100美元和60美元的价格线上都有了DX11新产品,很好地抓住了Windows 7/DirectX 11带来的市场增长点。
[9.跳跃至40nm的代价]这部分内容其实可以独立成章,但因为它直接影响了Cypress和整个Evergreen系列显卡,所以这里赘述一下。
你一定对台积电40nm工艺存在的问题有所耳闻,虽然这些问题现在已经得到了解决,但是正是良率极差、改进缓慢这些问题导致了去年Cypress核心显卡的缺货以及NVIDIA Fermi/GF100的延期。接下来,我想说一下向40nm制程迈进的事,同时也探讨一下为什么这个进程如此艰难。
对无晶圆厂的半导体公司来说,最大的问题在于,在推出新产品时你必须对付各类供应商,比如显存厂商、元件制造商和拥有你所需知识产权的厂商,你还必须处理与代工芯片生产商的关系。更糟的是,每隔一年左右的时间,你的代工伙伴就会向你兜售全新的制程。
他们的理由基本大同小异,比如说,新的制程更精细、运行更快、功耗更低。和所有推销员一样,他们总是希望你尽快采纳最新最贵的制程和工艺。在PC行业中,他们会在这些工艺没有准备充分之前就督促你购买。
不用担心,他们会为你提供一份设计清单和注意事项,如果你遵循所有规则,他们能确保生产出你想要的芯片。换句话说,“我们说什么你做什么,你的芯片就可以量产”。
Global Foundries的2010年至2011年制程路线图
问题是,即便你完全按照这些规则去做,新的芯片也不会比使用旧的制程快到哪里,你所获得的量产速度和之前相似,但是成本却高出很多。
一般来说,两个制程节点之间晶圆的大小不会发生变化。之前的200mm晶圆使用了相当长的时间,现在才进展到300mm晶元。然而晶体管的尺寸确实有了不小的变化,因此理论上讲,随着制程的发展,晶圆上可容纳的芯片也更多。
因为新的制程更加复杂,因此它会导致晶圆成本价格的上涨。如果晶圆成本高出50%,那么你需要在每片晶圆当中至少多放入50%的芯片,才能保证成本和旧制程持平。实际确实如此,但是如果你遵循代工厂的规则以确保量产,那么你将无法实现收支平衡。
最终的结果是你从新制程当中的获益为零。对于想利用摩尔定律来实现收益的企业来说,者可不是什么明智的选择,尤其是对于GPU厂商。
这只有一个解决办法,那就是公司里有那种十分睿智的人,可以审慎地分析代工伙伴提出的设计标准和注意事项,并找出可以忽略的部分以及需要着重对待的部分。在这个方面,ATI和NVIDIA有着很大不同。
[10.制程VS架构:ATI与NVIDIA背道而行]从NV30(GeForce FX)开始,NVIDIA就不再第一个转向新制程。NVIDIA选择在芯片架构设计上投入更多资源,而不是让硬件工程师花费大量精力在新工艺和新制程上。ATI则截然相反,他们对新的制程节点没有那么排斥,并将更多的工程研发资源都放在了制造方面。这两种方法各有千秋,都是从自身情况出发。
NVIDIA的方法意味着,即使采用成熟的制程也有可能翻船,而且当重大制程间进行转换时(如55纳米到40纳米),NVIDIA的竞争力会被削弱,因为它需要花更多的时间来调整架构,使其更具竞争力。ATI在RV770上将主要工作放在了架构设计上,结果也让人十分满意。
在同Carrell谈话时他指出,制程之间的转换并不能用过渡来形容。因为过渡意味着平稳地实现了从一种技术到另一种技术的转换,但是,重大晶体管节点技术之间的转换(例如55nm到45nm,而不是90nm到80nm)更像是跳跃而不是过渡。
每次制程节点之间的跳跃都会有极大的风险,作为一家半导体厂商,关键在于如何降低这种风险。
在某些时候,制造商必须使用新的制程节点来制造芯片,否则就会面临着被市场淘汰的危险。如果你的芯片比别人落后了不止一个制程,那在竞争中你就处于劣势地位。问题出现了,哪些芯片应该采用新制程?哪些不需要呢?
对于这个问题,通常有两种不同的选择:小跳跃或大跳跃。这里的大小是从芯片尺寸上来说的。
小幅跃进的支持者认为,在新制程里,缺陷率会很高,晶圆上会出现很多次品,因此为了降低缺陷率的影响,芯片尺寸应该尽可能的小。
如果一个晶圆上有100个有缺陷的芯片,那么如果这个晶圆可以容纳1000个芯片,那么每个芯片损坏的几率仅有10%。
大跳跃当然就是反面情况了,如果你在新制程中使用大尺寸芯片设计,那么一个晶圆上只能容纳200个芯片,而这其中就有100个有缺陷的芯片,芯片缺陷率就达到了50%。
如果仅考虑量产,那么小跳跃是最佳选择。但是大跳跃显然也有其优势,其中一个最明显的好处就是,如果你可以成功(比如击败竞争对手)那么它会为你带来比小芯片高出很多的利润。
另一个不太显眼但是却更为重要的理由是,由于大芯片往往更容易失败,因此更容易暴露新制程的问题。失败的几率越大,你就有越多的机会来了解新制程中的早期缺陷。
对于产品来说这是有很大风险的,但是也为你带来了很多经验,你可以将其应用到今后采用相同制程的产品中。
[11.RV740对Cypress的帮助]在第一款40nm GPU的制造上,ATI采用了所能承受的最大尺寸芯片设计,也就是RV740(Radeon HD 4770):
ATI于2009年4月发布的第一款40nm产品ATI Radeon HD 4770
相反,NVIDIA则选取了小芯片设计来试水40nm制程。RV740芯片面积为137平方毫米,而NVIDIA的第一批40nm GPU产品G210和GT220的大小则分别为57平方毫米和100平方毫米。在发布的最初几个月内NVIDIA仅向OEM厂商出货,想必这其中G210的比重更大吧。直到GeForce GT 240发布,NVIDIA的40nm芯片的大小才与RV740相同。GT240是在2009年11月发布的,而Radeon HD 4770(RV740)则在2009年4月就已经发布,比GT240整整提前了7个月。
当ATI和NVIDIA同时开始将高性能GPU转换到40nm制程时,ATI已经拥有很多经验了,而且更清楚台积电在此制程上的一些问题。
ATI图形工程部副总裁王启尚很早就开始担心台积电的40nm制程问题,在RV740进行设计时他曾致电Carrell,告知了自己的疑虑。王启尚担心制造工艺中金属加工处理方面的不成熟会导致连接(via)出现质量问题,连接是芯片上不同金属层之间的微小连接物。40nm制程中的这种故障率非常高,足以影响采用该制程的产品进行量产。即使连接不发生完全故障,它的质量问题也会导致信号质量变低。
对于台积电40nm制程的另一个担心是晶体管规模的差异度方面,王启尚尤为担心晶体管通道长度在制造上的差异,他认为,台积电的40nm制程在这方面无法满足ATI的需求。
台积电虽然向ATI保证晶体管通道长度之间的差异会很小,但是Carrell和王启尚仍然十分担心,不过也无能为力。
连接问题很容易解决(当然代价也不低),王启尚决定将RV740的连接数翻倍,凡是两个金属层之间均采用两个连接。这会使得芯片变大,但是总比它无法工作好。
台积电开始制造第一批RV740芯片。当芯片拿回来后ATI发现它们工作时的温度超出了预期,在ATI预料之外的还有严重的漏电现象。
工程人员立即开始了找寻解决问题的办法,他们将芯片逐一拆分,没用多长时间就发现了问题所在,原来是晶体管通道差异度超出了界限。设计人员最终找到了一个办法,通过改变RV740的设计来解决了大部分的漏电问题。然而,性能仍然是个很大的问题,由于花费了太多时间去修复这些问题,RV740几乎成为一款失败的产品。
也正因为此,RV740为ATI带来了极大的贡献。它充当了清道夫的角色,为Cypress以及Evergreen其它产品的成功扫清了障碍。
NVIDIA会重蹈ATI在RV740上的覆辙吗?这很难说。不过很多人都认为在40nm制程方面NVIDIA不如ATI经验丰富。去年12月份,NVIDIA公开抨击了台积电,并要求他们实现零连接缺陷率。
很多Fermi的传言也证实,NVIDIA遭遇了和ATI RV740相同的问题:低良品率、芯片过热、时钟频率无法达到预期目标,当然我们还没有见到任何GF100,所以这些也只能当做传言来听。
当我询问NVIDIA为什么Fermi会姗姗来迟时,他们把原因归咎于部分架构问题,而不是制造方面的问题。如果Fermi的延期是NVIDIA向台积电40nm制程交的学费,相信其下一代产品的发布会更加顺利些。
我并不是说台积电不懂得制造,只是在向40nm制程迈进时这一步跨地有些大:
你可能还记得,在讨论Cypress的时候Carrell曾认为台积电的40nm制程并不便宜,但是当时很多人,不论是在ATI还是NVIDIA,都不相信这种说法。我问Carrell为什么他能知道这个,他回答说这是多年来的经验,并讲述了很多内容,但是这些我不能在此公开。
[12.提防无间道:“宽域”是如何诞生的]Carrell Killebrew还做了一件十分重要的事,那就是一肩承担了宽域(Eyefinity)技术,并将它带入Evergreen系列。
事情还要从头说起,显卡厂商一般会经常征求OEM厂商的意见,询问他们有什么需要的功能。笔记本厂商想要一个可以支持6个显示屏输出的GPU,其中2个用于LCD面板,2个用于其它输出(VGA+DVI/HDMI),另外2个用于扩展插口。
Carrell认为如果这6个输出不能同时被驱动,那么就太遗憾了。因此,他胸中有了一个计划,任何Evergreen显卡都可以至少同时驱动3台显示设备,高端显卡则可以同时支持6个显示器。
今天这种技术已经实现了,就是“宽域”,不过Carrell称它为“太阳黑子”(SunSpot)。Carrell并不想让其他人参与到“太阳黑子”中,因此并没有将其写入Cypress的PRS文档中。即使是在做出削减RV870尺寸的决定做出之后,Carrell也没有透露“太阳黑子”。他知道,一旦风声泄露,这个功能就会作为RV870尺寸缩减的牺牲品,而且如果被亲信之外的人获悉了“太阳黑子”的存在,那么NVIDIA就有可能将它抄袭过去。
Carrell制订了一个名单,只有确实有必要接触到“太阳黑子”的人的名字才会出现在这份名单上。人员就位后,该项目组就开始了研发工作,不过直到最后一分钟软件工程师才知道“太阳黑子”的存在,Carrell只是给他们充足的时间来为“太阳黑子”开发程序,对于它的存在他们则完全不知情。
Carrell找到ATI软件工程部的负责人David Glenn,让他给出完成相关驱动程序和软件研发的最后日期以及必须知道“太阳黑子”的相关软件人员名单,David Glenn给了他最终日期和3个人名。某一天,“太阳黑子” 项目组把这3个人召集到一起,然后说“我们需要告诉你们一些事情”。当然,没有人会对保守Carrell的秘密感到高兴。ATI的部分高层知道Carrell正在组织人员研究一些什么,但是他们不知道究竟是何物。
Carrell对“太阳黑子”的保密工作还遇到了更棘手问题,为了能够让“宽域”工作,他需要取得其它厂商的支持才行。不知你是否还记得,在Radeon HD 5800系列发布的同时,三星宣布了它的超薄边框显示器将以单屏、3屏组合以及6屏组合出货,专门适用于宽域技术。
在与三星这样的OEM厂商合作时,你不可能再对“太阳黑子”项目保密了。如果说ATI的内部人士都有可能向NVIDIA泄密,那么与双方都有合作的厂商就更有可能泄密了。然而Carrell却做到了对“太阳黑子”的完全保密,这不得不说是一件奇事。
“太阳黑子”的秘密一直保守到了RV870流片前,这时AMD的图形产品部门主管Rick Bergman表示,有三个能真正获益的重要客户应当知道“太阳黑子”项目,而且这有助于提高ATI的竞争力。
AMD法律专家将“太阳黑子”列为专有知识产权,即使是签订合约后的OEM厂商内部有其他人想了解该技术,也要获得AMD的同意。Carrell为“太阳黑子”起了三个不同的名称分发给了三家OEM厂商。
令人惊奇的是,三家厂商都严格遵守了协议,并未走漏任何风声。
尽管NVIDIA在今年的CES国际消费电子展上也展示了自己的三屏显示技术,不过这是一个纯软件解决方案。每个GPU仍只能支持双显示通道输出。
ATI以前也曾考虑过纯软件解决方案,但最终还是否定了这种方案。如果使用纯软件解决方案,你需要一个多GPU系统,这意味着更昂贵的主板、更强大的电源以及更繁琐的配置,而且还要面临可能发生的性能问题。
其中一种情况是,你会明显感觉到不对称,因为你的一个显卡驱动一台显示屏,而另一个显卡则驱动两台显示屏。另一种情况是,三台显示屏都由同一个显卡驱动。在交替帧渲染模式下,你可通过PCI-E或CF/ SLI将一个GPU中的数据传送至下一个GPU。Carrell表示,在6个显示器的情况下,很难有充足的带宽保证数据传输速度。
不选择软件方案还有一个主要原因,那就是游戏兼容性问题。虽然在当今的很多游戏运行时,宽域仍然会导致明显的视场和屏幕高宽比问题,但是相比Carrell的预期已经是很好的效果了,当然,这比使用软件方案要强上更多。
“太阳黑子”所进行的保密工作是不是让人觉得有些荒唐?不过这可不是Carrell拿来消遣的,AMD已经将这种保密方法纳入了对未来其它功能的管理方案中,真想知道Carrell是不是设法获得了苹果的那套保密方法。
[13.结语]因为这并不是一个产品评测文章,所以最后的结语部分内容并不多。其实早在去年我就已经知道ATI采取了一种全新的GPU设计方法,并将它完全应用到了RV870的开发中。新一代GPU“Northern Islands”在RV870生死未卜的时候就开始了设计,并将在今年晚些时候发布。
不知道我们从RV770到RV870的研发中所获得的信息能否告诉大家该对“Northern Islands”抱有什么样的期待,虽然我们无法对ATI的未来产品做出预测,但是对于AMD图形部门的工作方式却得到了切实的了解。
Carrell告诉我,产品的开发过程并不那么条理分明,虽然也有一定的逻辑因素,但它更像是一个论证式过程。不是说这其中有什么矛盾,而是指当数据不存在时去开发新的数据。当AMD或是NVIDIA计划推出新产品时,工程师们并不清楚所有的答案,他们现有的知识并不能派上大用场,真正有用的是可能性、权衡和猜测。
有时候他们的猜测是正确的,有时候却是错的。他们唯一能做的就是用自己的个人经验来验证各种猜测。这么多年过去了,ATI似乎终于学会了组织团队所有成员的力量,并将其投入到产品的研发中。
图形团队的专业和向新制程技术跳跃方面的经验在这一代图形处理器上卓有成效,从台积电转由Global Foundries代工将会给他们带来新的挑战,尽管这并不完全是制程技术方面的。
在经历了最近三代GPU产品后,ATI由一个业绩糟糕的传统GPU公司蜕变为蝶。不管你是A饭、I饭还是N饭,你都应该向它致以掌声。过去几年里,它作为AMD的图形部门为大家上演了惊人的转变。从R500和R600时期的跌跌撞撞到RV670、RV770和RV870的稳扎稳打,这一路值得赞许。