《电子技术应用》
您所在的位置:首页 > 微波|射频 > 设计应用 > 设计中不可或缺的热分析
设计中不可或缺的热分析
摘要: 记得从什么时候开始,热分析意味着撤回原型并确定是否需要额外加入两个散热片和一个风扇吗?现在再尝试这种方式你将发现身处泥潭却无计可逃。毕竟,热可能会影响电气性能并最终缩短平均无故障时间。
Abstract:
Key words :

  记得从什么时候开始,热分析意味着撤回原型并确定是否需要额外加入两个散热片和一个风扇吗?现在再尝试这种方式你将发现身处泥潭却无计可逃。毕竟,热可能会影响电气性能并最终缩短平均无故障时间。

  回顾我年富力强的工程时代,我在热分析上从未花费太多时间,因为那时真的不需要,我还知道像我这样的人并不是少数。但随着半导体每单位面积的功耗(及相应的发热)越来越高,以及系统体积不断缩小,越来越多未进行热分析的系统工程师发现自己身处困境。

  “许多过去由不同器件分担的功能现在被整合进一个器件内。”Ansys公司的产品经理主管Dave Rosato表示。因此,现在SoC类型器件的热密度要高得多。

  “工程师在5至10年前用于设计PCB的一般经验已完全不适应当今的设计了,”Rosato接着说。“数年前,PCB作为热传输路径的角色是被忽略的。现在,你必须将所有的热传输路径考虑在内。”

  “简单解决方案”是指在设计周期中尽早实施热分析。多早合适呢?最晚应在结构图设计阶段后立即就进行基本热分析。工程师需下载拟采用器件的数据手册并从热的角度体验一下未来将遇到的挑战。

  若该分析指出了潜在的问题,则工程师应考虑采用一些热分析模拟软件甚至还可能需要与材料厂商合作以确定它是否能制造出与设计参数相适应的一些东西。

  笔记本电脑中的热设计

  最近,我自己的一台笔记本电脑因与散热片/热管组块集成在一起的风扇电源故障而无法工作了。即使打开机壳使大量冷空气流通,这台电脑也启动不了,甚至在系统执行典型的上电自检(POST)前,“风扇故障”的信息也一直出现。

  当电脑感知到风扇供电不正常时,系统立即停止运行。基于的假设如下:一般的笔记本电脑用户在装有空调的房间内不会打开机盖,因此,CPU会经历致命的“热失控”。这种方法的不利之处是,由于风扇(或连接风扇的其它底层电源)不工作,而使整个系统也无法工作。

  这是一个关于笔记本电脑制造商明确在没有强制气流流经与CPU连接的散热片时,CPU决不启动的好例子。该设计按照这些要求进行了工程处理,因为笔记本电脑设计人员知道,不正确的热管理意味着危险即将到来。实际上,英特尔和AMD都非常严肃地对待这一问题。

  例如,“如果外部热传感器检测到处理器温度达到致命的125℃(最大值),或有THERMTRIP#信号显现,则在500ms之内,处理器的VCC电源必须关闭以防止因处理器热失控造成的永久性硅损坏,”英特尔在其2008年1月版的Core 2 Duo Processor数据手册中强调。

  “保持合适的热环境是系统长期、可靠工作的关键。一个完善的热方案包括器件和系统级热管理功能,”该数据手册写道。

  “为保证基于英特尔处理器的系统的最优化工作和长期可靠性,系统/处理器热方案应被设计为可使处理器维持在最低和最高结温(TJ)规范之间,并遵从相应的热设计功耗(TDP)值,”该手册指出。

  “注意:当处理器工作在这些极限指标之外,将可能导致处理器的永久性损坏以及系统内其它器件的潜在损伤,”该手册总结说。

  为什么这些公司对消除不正确的热管理如此兴师动众?“许多应用(系统)正变得越来越小,例如Mac Air;而热路径不仅变得更短,而且还被重新排列了,”Lord公司高级微电子技术科学家Sara N. Paisner说。

  通常,散热片被直接放置在器件上面。但最新技术将使热量向其它方向流动。“现在,散热片可能被放在器件下面,或者,也可能热通过电路板本身消散掉了,”Paisner指出。

  但热管理不再如此简单。“外壳材料同时担当电磁场(EMF)屏蔽和散热片的角色,这是由于壳体本身构成热路径的一部分,”Paisner表示。一个典型的PCB包括内置热路径,这使得系统设计师重新审视其设计策略。所有的器件都在缩小,现在,当为一个较大的区域散热时,是由几个器件共同分担冷却职责。

  从芯片角度来看,英特尔和AMD针对正确热设计采取的预防性措施很有趣。首先,英特尔指出,“为把温度限制在工作条件内,处理器需要一个热管理方案。”英特尔采用热二极管、数字热传感器(DTS)和Intel Thermal Monitor来监测裸片温度。

  热二极管可与热传感器一起用于计算硅温度。DTS是集成一个裸片上的传感器,它不停地监测并输出相对于最高热结温的裸片温度数据。当DTS中的一个特定位被置位时,将检测到可导致灾难性后果的温度条件。

  当硅片温度达到最高限时,Intel Thermal Monitor通过启动一个热控制电路来帮助控制处理器温度。这样,可以根据需要依次调整内核时钟以使硅片温度处于掌控中。

  此外,如果处理器温度在热跳变点以上,则该监控器将产生一个外部信号(PROCHOT#)。它还以可生成一个中断信号。如果该监控器失效,则将产生一个特殊信号(THERMTRIP#),以提示若不立即关断内核电压,则很快就会出错。

  AMD采用的是一种类似的方法。该公司的“Thermal Design Guidelines”白皮书提供诸如散热片的最大长度、宽度和高度等规范以及散热片和风扇材料要求等规范信息。

  虽然由于CPU需消耗很多热而成为一个重要的散热目标,但也不应忽视其它系统部件。此时,一些简单计算及一些基本热管理理论将发挥作用。

  记得从什么时候开始,热分析意味着撤回原型并确定是否需要额外加入两个散热片和一个风扇吗?现在再尝试这种方式你将发现身处泥潭却无计可逃。毕竟,热可能会影响电气性能并最终缩短平均无故障时间。

  回顾我年富力强的工程时代,我在热分析上从未花费太多时间,因为那时真的不需要,我还知道像我这样的人并不是少数。但随着半导体每单位面积的功耗(及相应的发热)越来越高,以及系统体积不断缩小,越来越多未进行热分析的系统工程师发现自己身处困境。

  “许多过去由不同器件分担的功能现在被整合进一个器件内。”Ansys公司的产品经理主管Dave Rosato表示。因此,现在SoC类型器件的热密度要高得多。

  “工程师在5至10年前用于设计PCB的一般经验已完全不适应当今的设计了,”Rosato接着说。“数年前,PCB作为热传输路径的角色是被忽略的。现在,你必须将所有的热传输路径考虑在内。”

  “简单解决方案”是指在设计周期中尽早实施热分析。多早合适呢?最晚应在结构图设计阶段后立即就进行基本热分析。工程师需下载拟采用器件的数据手册并从热的角度体验一下未来将遇到的挑战。

  若该分析指出了潜在的问题,则工程师应考虑采用一些热分析模拟软件甚至还可能需要与材料厂商合作以确定它是否能制造出与设计参数相适应的一些东西。

  笔记本电脑中的热设计

  最近,我自己的一台笔记本电脑因与散热片/热管组块集成在一起的风扇电源故障而无法工作了。即使打开机壳使大量冷空气流通,这台电脑也启动不了,甚至在系统执行典型的上电自检(POST)前,“风扇故障”的信息也一直出现。

  当电脑感知到风扇供电不正常时,系统立即停止运行。基于的假设如下:一般的笔记本电脑用户在装有空调的房间内不会打开机盖,因此,CPU会经历致命的“热失控”。这种方法的不利之处是,由于风扇(或连接风扇的其它底层电源)不工作,而使整个系统也无法工作。

  这是一个关于笔记本电脑制造商明确在没有强制气流流经与CPU连接的散热片时,CPU决不启动的好例子。该设计按照这些要求进行了工程处理,因为笔记本电脑设计人员知道,不正确的热管理意味着危险即将到来。实际上,英特尔和AMD都非常严肃地对待这一问题。

  例如,“如果外部热传感器检测到处理器温度达到致命的125℃(最大值),或有THERMTRIP#信号显现,则在500ms之内,处理器的VCC电源必须关闭以防止因处理器热失控造成的永久性硅损坏,”英特尔在其2008年1月版的Core 2 Duo Processor数据手册中强调。

  “保持合适的热环境是系统长期、可靠工作的关键。一个完善的热方案包括器件和系统级热管理功能,”该数据手册写道。

  “为保证基于英特尔处理器的系统的最优化工作和长期可靠性,系统/处理器热方案应被设计为可使处理器维持在最低和最高结温(TJ)规范之间,并遵从相应的热设计功耗(TDP)值,”该手册指出。

  “注意:当处理器工作在这些极限指标之外,将可能导致处理器的永久性损坏以及系统内其它器件的潜在损伤,”该手册总结说。

  为什么这些公司对消除不正确的热管理如此兴师动众?“许多应用(系统)正变得越来越小,例如Mac Air;而热路径不仅变得更短,而且还被重新排列了,”Lord公司高级微电子技术科学家Sara N. Paisner说。

  通常,散热片被直接放置在器件上面。但最新技术将使热量向其它方向流动。“现在,散热片可能被放在器件下面,或者,也可能热通过电路板本身消散掉了,”Paisner指出。

  但热管理不再如此简单。“外壳材料同时担当电磁场(EMF)屏蔽和散热片的角色,这是由于壳体本身构成热路径的一部分,”Paisner表示。一个典型的PCB包括内置热路径,这使得系统设计师重新审视其设计策略。所有的器件都在缩小,现在,当为一个较大的区域散热时,是由几个器件共同分担冷却职责。

  从芯片角度来看,英特尔和AMD针对正确热设计采取的预防性措施很有趣。首先,英特尔指出,“为把温度限制在工作条件内,处理器需要一个热管理方案。”英特尔采用热二极管、数字热传感器(DTS)和Intel Thermal Monitor来监测裸片温度。

  热二极管可与热传感器一起用于计算硅温度。DTS是集成一个裸片上的传感器,它不停地监测并输出相对于最高热结温的裸片温度数据。当DTS中的一个特定位被置位时,将检测到可导致灾难性后果的温度条件。

  当硅片温度达到最高限时,Intel Thermal Monitor通过启动一个热控制电路来帮助控制处理器温度。这样,可以根据需要依次调整内核时钟以使硅片温度处于掌控中。

  此外,如果处理器温度在热跳变点以上,则该监控器将产生一个外部信号(PROCHOT#)。它还以可生成一个中断信号。如果该监控器失效,则将产生一个特殊信号(THERMTRIP#),以提示若不立即关断内核电压,则很快就会出错。

  AMD采用的是一种类似的方法。该公司的“Thermal Design Guidelines”白皮书提供诸如散热片的最大长度、宽度和高度等规范以及散热片和风扇材料要求等规范信息。

  虽然由于CPU需消耗很多热而成为一个重要的散热目标,但也不应忽视其它系统部件。此时,一些简单计算及一些基本热管理理论将发挥作用。

  把结点与散热片连接在一起

  热管理把热从半导体结扩散到附近环境中。典型情况是,热从半导体被传导到封装,然后再到热扩散器(散热器),最终到周边环境。你的设计也许没有散热器,也即采用的是类似风扇和管线等其它技术。

  但一般理论是一样的:把热从一小区域扩散向一个大区域。根据热传导的基本理论,材料的热导率与热流动的垂直区域和温度梯度成比例。

  结温是半导体结的工作温度(一般以℃表示),在这里产生的热最多。指定参考点(如结或壳体)的热阻抗是每单位功耗(一般以W表示)高于一个外部参考点(如:因脚、壳体或环境温度)的有效温升(一般以℃表示)。

  热阻抗以θLetter1Letter2表示(即:θCA或θJA)。Letter1是指定参考点,且该字母一般表示该参考的初始值(即,C=壳体;J=结)。Letter2是外部参考点且具有类似的表述结构(即:A=环境)。

  粗略计算

  当执行一个正式热分析时,目标是提供理解热是如何形成并如何在系统内流动的完整把握。但在开发阶段初期,一个简单的大致估算也许就足够了。

  想法是,在上电后,对发热情况有个大致把握。另一条规避无意间招致缩短平均无故障时间的途径是使器件或系统过热。

  一旦进行计算,就应大致了解你所用热管理方法所需的复杂程度。也即,是打算再增加一个散热器还是需热管的更新奇方案或其它一些采用热扩散、强制气流甚至新材料的混合方案?即使借助简单的类似增加热过孔等手段就可满足要求,未雨绸缪、防患未然也总比事后“付之一炬”好得多。

  那如何进行粗略热分析呢?据Flomerics的电子制冷工程督导Byron Blackmore介绍,首要进行的是PCB正反两面的总体功率密度计算。“可通过计算总体功耗并除以表面积来表示它,”他说。

  Blackmore还提供一个大致经验规则:若计算显示,你设计的功耗密度超过1.5W/in.2,就应考虑增加其它措施以避免使热产生连带影响。

  Paisner还连带给出了一些指导数据。“决定是否采取额外举措的一个关键决定性因素是温度,”她说。85℃以内可接受,85℃到100℃可能也行、但要小心从事。但,在100℃以上,一般应采取附加措施。当然,除绝对温度外,你还应考虑随着系统条件的改变,温度会如何随之变化。

  如何实现?“用每个器件在PCB可能工作的最高温度下的最大功耗并除以表面积,然后对PCB的另一面重复该计算,”Blackmore说。然后,你必须找到热阻抗(即:θJA)并乘以预期的功耗以确定高于环境温度的温升。现在,将该值与器件标称的最高温度相比。

  注意:列出的θJA是就“凝滞的空气”说的,你必须把其它因素考虑在内,特别是你计划使空气在系统中流动时。一些数据手册也许给出在特定气流流动速率下器件的热阻抗(即:θJMA)。但显然,若你的设计接近这些极限值之一,你或许应考虑增加其它热管理措施,且也许还是该考虑采用仿真软件的时候了。

  对给定设计来说,这些计算也许足够了,特别是若系统框架有许多自由空间时更是如此。那么,何时需要额外的热分析呢?

  “理想情况是,你该做两次热分析:一次是当该项目就PCB大小和将采用的器件有大致概念后;另一次是基本布线完成后,”Rosato说。重复一遍,根据你的系统,在该布局后阶段,你应考虑利用热分析软件实施准确得多的仿真(图1)。

  缺少热分析将使设计心血面临危险

  对布局和机架的考虑

  必须尽早且经常进行热分析。一些设计师甚至打算在申请专利前考虑该问题,因为若产品因热问题而失败,则问题出在哪里?但其它因素影响系统设计。

  “系统工程师必须理解材料与各自封装尺寸和种类间的互动有多么不同,”Paisner说。“类似Lord等公司与客户一道研发新材料来满足热要求。”

  Paisner以苹果的Mac Air笔记本电脑为例说明产品遇到的严峻设计挑战,类似的这种设计不太可能有充足空间安放大散热器或其它冷却技术。这样,除非你打算不惜血本采用新奇的热方案,否则极小的空间限制将是很棘手的障碍。

  “热通路越复杂,成本越高,”Paisner说。“你必须想方设法把热排出系统,另外,在材料和布局间,你情愿承受怎样的平衡。”

  另外,从热角度,器件排布在布局过程中起着关键作用。“建议将高发热器件摆放在靠近通风孔的地方,但这种要求并非总能满足,所以,也许需要其它折中,”Rosato说。

  另外,功耗很大的器件也许会产生对其它器件极易施加影响的“下流”热。另一个窍门是把发热器件紧邻着摆放并一般放在气流回路中。另外,“需要时,可采用分流器(diverter)流布气流,”Rosato指出。

  从布局角度,应充分关注堆叠裸片和堆叠芯片封装器件,因更高的器件一般会妨碍热通路。另外,可直接焊装在PCB(器件和PCB间没有任何气隙)上的器件可把PCB作为散热器。另外,还可设计进热过孔,但一般情况是你应了解应在布局前想好把它们放在哪里。

  Blackmore介绍,布局中一个值得仿效的作法是努力使任何冷空气的“风头”吹过发热最多的器件。把器件散布以避免给下游产生热气流同样是明智之举。最后,“高的器件和连接器可能形成影响气流向下流通的气阻,”他说。因此,对任何高的器件和连接器都应特别对待、进一步分析。

  无用的输入输出

  别为你用的器件集假定最大功耗。在计算阶段,最大值对你大致把握设计基本情况有用。但你必须坚持采用更真实的数据,否则,设计有可能变得过工程化、增加不必要的重量和成本。

  若你采用了FPGA,则要弄清,其内部逻辑是否在所有时间都工作在最高速度?很可能不是这样的,所以,请逻辑工程师就更现实的工作情况给你一个合理的估算。然后,该你来决定是否需增加一个修正因数(fudge factor)。

  记住:FPGA制造商的工程团队、测试团队和销售/营销部门也许已经把三个不同层次的修正因数内置其中。若你能得到实际使用数据并为此添加些修正,则以后将顺手得多。

  公司都会问最重要的问题:错误比率是多少?提供的数据与“真实数据”相比有怎样的关联?数值都验证过了吗?在最终环境用实际材料测试过了吗?

  在采用实际热仿真工具的地方,你可得到精准得多的更好体验。“热分析仿真工具应能读进布线和PCB设计信息,包括来自EDA工具的线段、平面和过孔定义等,”Rosato说。

  仿真工具还可包含系统封装、详尽的器件设计参数等信息。“仿真工具可预测工作温度来评判是否有可能超过标称结温度以及在哪里系统会出现‘阻滞空气’”Rosato说。也可采用交互式仿真方法,其中,工程师可演练各种热管理情况、添加散热器、若需要则返回仿真结果。

  类似PCB外形和大小以及诸如金属层信息等相关的PCB建构数据等参数也被读进,Blackmore说。流程的剩余部分涉及系统工程师描述系统将运行其中的环境,包括:框架、通风孔、电源和其它器件等信息。然后,将全部信息组合在一起提供一个热仿真。

  未来发展

  现在,你了解了热分析的基本原则和重要性以及行之有效的热管理技术。但即使考虑了全部其它防范措施,当设计接近或超过其中一些极限(如:1.5 W/in.2)时会出现怎样的情况?

  图2:Nextreme OptoCooler模块可用于为TO-56封装的激光二极管制冷。

  图2:Nextreme OptoCooler模块可用于为TO-56封装的激光二极管制冷。

  你大概了解散热器、风扇、集成了风扇的散热器等技术间的长短取舍。但对更先进的方案又了解多少?许多公司提供热产品和方案。

  “传统方案业已过气,所以需要增加其它功能来拓展性能范围,”Nextreme的CTO Seri Lee说。例如,热管具有固态制冷所以应比单独的散热器和风扇先进,虽然热管既大且笨还贵又常常需要定制。

  缺少热分析将使设计心血面临危险

  Nextreme有几项芯片级创新,它采用比典型方案薄和小10到20倍、但排热能力却高10到15倍的技术主动把热排出(图2)。Bergquist制造几种不同的热材料和热基板。Ansys也提供热仿真工具(图3)。

 

此内容为AET网站原创,未经授权禁止转载。