今年夏天,NVIDIA在财报会议上承认,由于部分移动GPU产品在封装过程中存在问题,导致使用中可能出现问题。戴尔、惠普、苹果等厂商随之先后宣布对搭载部分GeForce 8系列显卡的笔记本提供免费维修服务。
这一问题说来奇怪,NVIDIA和AMD这一对竞争对手在GPU制造上依赖的都是台积电等台湾厂商,从代工工厂、封装工厂到所用工艺几乎完全相同。为什么单单NVIDIA的GPU出现问题,AMD却能够独善其身呢?日前,AMD公司专门负责封装和互联技术的主管Neil McLellan接受了媒体的采访,对AMD在GPU封装中采用的技术进行了介绍,从一个侧面也解释了NVIDIA出现这种问题的原因。
要谈这个问题,首先需要从被AMD收购之前的ATI说起。当时由于在游戏主机中使用的GPU封装材料出现问题,再加上欧盟提出的RoHS环保条例开始限制半导体封装中的有害金属应用,ATI雇佣了Neil McLellan专门主管封装工艺问题。从2005年开始,RoHS要求封装后的GPU在与PCB板焊接时采用无铅锡球(Solder Ball)。趁这个机会,AMD也将GPU Die与基板封装时的所用的焊接凸点(Solder Bump)材料从高铅凸点转换为低熔点锡铅凸点。
高铅凸点含有90%的铅和10%的锡,而低熔点铅锡凸点的构成是37%的铅和63%的锡。铅能够承载更多的电流,但AMD认为高铅凸点更易老化,在可靠性上有所欠缺。特别是在温度快速变化时,使用高铅凸点封装的GPU容易出现问题。出现这种情况的原因是,从硅晶圆上切割下来的GPU芯片与封装基板之间存在热胀冷缩率的差异,硅芯片为每摄氏度百万分之二,而封装基板为每摄氏度百万分之三十。这种差异导致温度变化时连接芯片与基板的凸点承受了相当大的拉力,久而久之就容易出现问题。
低熔点锡铅凸点避免了这种问题的发生,但它也有自己的缺点。比如,它的高电流承载能力不如高铅凸点,在出现高电流时容易出现电子迁移现象。由于GPU个部分有不同的功耗,因此经过有些凸点电流可能只有50mA,而有些凸点此时可能达到600mA。为避免电流过载,AMD在凸点和芯片之间增加了一层金属,重新对电流进行平均分配。
无论AMD还是NVIDIA的GPU,封装工作都是在矽品、日月光等厂商中进行的,不同厂商往往采用不同的工艺或材料。AMD在决定使用新的封装设计与材料后,将设计规范提供给封装厂商要求它们遵守。封装厂商方面,虽然愿意按照客户的要求进行制造,但他们并不对由此可能产生的后果负责。当然从现在来看,AMD使用的低熔点锡铅凸点工艺并没有出现什么问题。而且,新工艺制造成本更低,良品率更高。“从财务上来看,我们没有理由不采取一种更加可靠的封装技术”。
反观NVIDIA,虽然Neil McLellan并不愿意过多评论竞争对手。但还是可以从他的话中听出,NVIDIA并不太重视封装工艺问题。他认为NVIDIA的移动GPU应当采用的是高铅凸点,在笔记本中使用温度经常快速变化,导致了问题的发生。而桌面版本虽然散热状况没有笔记本那么恶劣,但在长期使用后仍然不免出现同样的问题。
未来,RoHS规范将于2010年要求芯片制造过程中无论锡球还是凸点均要采用无铅工艺,AMD的一些客户甚至要求更早实现该目标。McLellan表示,这将是一个全新的问题,并且更加艰巨。他已经为此工作了一年半的时间,而NVIDIA应当也已经付出了同样的时间和精力来解决封装设计问题。