性能]嵌入式工程师解析NDS和PSP硬件真正能力

 常见问题     |      2024-06-30 18:10:47    |      小编

  念起这个中央的情由是看到一则音问“表国玩家将NDS超频到了100MHz”,连结永远以前就有的“PSP的CPU降频1/3 操纵”的讯息,让人实正在是对NDS 和 PSP 硬件能力的比较感应很好奇硬件硬件。于是查阅了极少原料,结果让人大吃一惊:两者的差异远没有之前极少人理解的1 :5 那么悬殊,任天国老谋深算的窜伏了能力。

  咱们先看看NDS:民多都清晰NDS采用了两个CPU ,一块是ARM946E-S,它有8k字节指令缓存和4k字节数据缓存,往往就业正在 67 MHz ;另一块是33MHz 的ARM7TDMI,有 64 k 字节内存。他们共享32 k字节的高速缓存。当然这些都是家喻户晓的状况,可是倘使是从事嵌入式修立拓荒的同伙看了这些多半会出现疑义:ARM946E-S 怎样会只可跑到67 MHz,ARM7TDMI怎样会只可跑到33MHz.本相上ARM9架构属于目前嵌入式CPU 中的中端产物,主流的频率应当正在200-300MHz安排,ARM7架构属于中低端的产物,可是主流频率也正在100-200MHz安排。并且这也不太或许是任天国公司技能能力太差,移植IP的时间功能吃紧缩水所致。由于具有ARM系列的ARM 公司选用的贸易战略是只授权硬IP核,即直接交付临蓐用的国畿,底子不承诺用户修削,以是正在这方面任天国底子没有出缺点的机缘。

  我从电子安排规模的专业渠道明白到的原料显示,NDS 的ARM946E-S 实质能够就业到200MHz,ARM7TDMI实质能够就业到133MHz,请民多戒备,这里的频率均不是超频的结果,而是安排的平常就业频率。至于这么做的真正情由,畏惧只要任天国自身才清晰。

  但是咱们能够猜念:或许是为了省电的身分,也有或许是目前软件的程度只须要如斯,便是不要妄念这是任天国的安排失误,本相上他们正在硬件安排上“合理就好”的偏向很彰着,当年正在NGC推出前改规格,下降GPU频率,普及CPU频率,避免瓶颈的事就证实了这点。

  咱们再来看看PSP 的状况:PSP 有两个1.2V MIPS 4KE CPU 内核,能够运转到 333 MHz,但平常时钟不领先222 MHz ,这或许是出于功耗商量。一个内核解决大大都体例代码和游戏代码,另一个内核填补了2M字节嵌入式DRAM,掌管音频、

  静止图像、视频等媒体的解决。PSP 有4M字节嵌入式DRAM以及32 M字节离散 DRAM. 彰着SONY方面也选用了和任天国好似的降频战略,只但是气势上如故差了点。

  当然极少业内人士笃信要笑我歪缠,哪有如许对照两个分歧架构CPU 功能的,并且CPU 的功能也只是具体的一局限。好,请听我不停理解。

  ARM 公司目前是寰宇嵌入式CPU IP授权墟市的大哥,但是ARM7架构是97年安排推出的,具有或许供应0.9MIPS/MHz 的三级流水线年安排推出的,具有或许供应1.1MIPS/MHz 的5 级流水线系列还供应了加强的DSP解决才干,但是这两个都算不上最新技能。PSP 的CPU IP供应者是MIPS公司,它是寰宇嵌入式CPU IP授权墟市的老二,固然来头稍幼一点,可是它供应的MIPS 4KE CPU内核属于最新的MIPS32架构,具有或许供应1.5MIPS/MHz 的5 级

  流水线要强不少。原来MIPS32 4KEc 内核正在TSMC(台积电)的0.13微米造程下所能抵达的最高频率是233MHz,可是SONY方面又糟蹋血本,它们正在日本长崎县谏早市的索尼半导体「SCEI Fab」晶圆厂采用的是0.09微米造程,以是同样的CORE,它们的能够跑到333MHz. 但是这也或许是SONY方面的无心之过,从表面上说更先辈的造程除了能够带来更高频率,更低的本钱表,也能够带来更低的功耗。可是刚巧正在0.09微米这个工艺节点,因为对深亚微米工艺的特征领会

  亏空,正在超低K 值介电质料的拓荒上没有跟上,显示了很吃紧的泄电流题目,导致功耗不光没有下降,还擢升了。一共的半导体成立商均是如斯,更吃紧的是,比如INTEL ,能够通过操纵厥后拓荒的超低K 值介电质料处分这个题目,以至直

  接升级到更先辈的0.065 节点,可是SONY因为游戏机的硬件同一性,很难选用犹如的格式。

  第一批PSP的程度就决计了之后一共PSP的程度,他是PSP这个木桶的最短一块板。咱们难以设念SONY会公布如许的告诉:“2006年X 月前临蓐的PSP,CPU跑正在222MHz,2006年X 月后临蓐的,CPU 能够跑正在366MHz,用户能够自行采选”,如许的话,软件拓荒商和用户非造反弗成!从这一点理解,固然SONY颁发的CPU 最高就业频率是333MHz(目前是222MHz),并且目前也实在存正在手腕让PSP跑到333 ,可是这并不料味着SONY会正在另日承诺拓荒商将实质就业频率普及到333MHz,由于这会导致初期版本的PSP 功耗领先SONY方面正在造订规范时的预期,从而发作担心稳。333MHz很有或许成为非官方软件的专利。相对而言,任天国不存正在这个题目,他操纵的是成熟产物和成熟工艺,没有弗成预期的状况,ARM 架构又以功耗低知名,NDS 抵达安排的就业频率没有什么疑团,由此导致的络续才干下降不会领先2幼时。

  倘使SONY方面最终能普及就业频率,可是达不到333MHz这么高,那就会是0.34-0.51 之间的某值别的再商量CPU 的其它方面,NDS 装备了ARM946E-S 和ARM7TDMI,目前任天国不甘心会商解决器内核之间的成效划分题目,但是遵从过去的多代家用游戏机的常规,如许的一主一辅两个CPU 的安排,日常是主CPU掌管游戏的视频和其它首要运算,辅CPU 掌管音频和输入解决等运算,这种划分格式早已被业界熟练,操纵上应当不存正在题目。SONY方面的状况对照杂乱,PSP 有两个1.2V MIPS 4KE CPU 内核。一个内核解决大大都体例代码和游戏代码,另一个内核填补了2M字节嵌入式DRAM,掌管音频、静止图像、视频等媒体的解决。这不是目前时兴的双内核机合吗?

  原来否则,目前INTEL 和AMD 热推的双内查对操纵顺序而言是弗成见的。解决器内核的移用流程是由OS掌管的。可是这种格式须要强大杂乱的OS作援帮,效力也不高。游戏机这种嵌入式安排全体分歧,操纵顺序自身掌管解决器内核的移用流程,这种格式高效,可是难度很高。回想史乘上采用对等式双CPU安排的游戏机,比如SEGA土星等,无不是让顺序员们癫狂的平台。从表面上说土星的双SH2 (20MHz )比PS的单R3000 (30MHz )是要强极少的,可是除了SEGA自身的AM2 ,AM3 的王牌幼组,没有人能够把这两个CPU 的才干都全体表现出来的,大都土星游戏实质只运用了一个CPU(我认可这一点坊镳无法表明MS正在XBOX360中采用了3CPU core 的安排,可是MS正在XBOX360 跑了WINDOWS XP,这和这一代掌上游戏机采用的OS底子不是一个级另表东西)同样的我对付绝大大都日本游戏拓荒企业或许把两个MIPS 4KE CPU内核统共666-999MIPS 的才干全体表现出来体现猜忌。

  这里没有采信某些原料上说的PSP的VFPU拥有2.6Gflops的说法,情由是MIPS官方没有犹如的说法,并且ARM9E同样是有FPU的内存方面,两者的原料都亏空,NDS 的两个 CPU共享32 k字节内存,还带有4M字节的体例 DRAM ,而PSP 有4M字节嵌入式DRAM以及32 M字节离散 DRAM ,PSP彰着由于具有巨额的高带宽嵌入式DRAM而据有上风,总内存也多得多。但是咱们也要商量到PSP 须要巨额内存缓冲他的UMD 驱动器,并且3D解决这类低数据汇集度的运算对付内存带宽的敏锐远高于对内存容量的敏锐。总体上PSP 正在这方面的上风没有他正在纸面上显示的那么大。

  NDS 的3D图形引擎每秒能够传输高达400万个几何极点或12万个多边形,并声称有3000万像素/ 秒的填充率。又有独立的音频加快硬件。

  SONY官方扬言PSP的双内核图像解决器运转正在166 MHz,并将图像流水线划分为两类义务:一个内核掌管弧线表面和几那里理,另一个则掌管纹理表面和像素陪衬解决。SONY正在斯坦福大学2004年IEEE Hot Chips 聚会上公然过PSP的全面规格,囊括 6.64 亿像素/ 秒的像素填充率,以及3300万多边形/ 秒的陪衬率。PSP 的数据是NDS 的几十倍以至上百倍,但是部分以为这个数据看看就能够了,过于夸诞了,PSP自身的像素但是130560个,6.64亿/130560=5085.78 ,这个倍数过分分了(NDS 的犹如数值是3000万/98304=305.17 ,商量到每秒30帧画面和比如FSAA的开销,至极合理)。

  SONY也正在PSP中操纵基于可重修设逻辑的VME(虚拟转移引擎)视、音频解决内核,它运转正在1.2V和166 MHz,能够达成3D 虚拟化、回响、声调限造以及其它音频解决成效。因为PSP 的加快硬件纸面功能过于夸诞,难以让人笃信,比如3300万个多边形/ 秒的陪衬率,仍旧逾越了Geforce3一级桌面显卡的程度,从目前技能来看,集成到PSP上不或许的,也无法和CPU 的解决才干配合(目前3D运算如故离不开CPU 的)。本相上MIPS扬言他的MIPS 3D ASE 硬件加快器能够抵达3700万个多边形/ 秒的陪衬率,可是这个MIPS 3D ASE 须要和MIPS64架构的CPU配合,而不是PSP的MIPS32,这两者的差异格表大。 那怎样办,这个比较怎么做下去呢?部分感触可以参照二者CPU的才干做个对照,PSP的加快硬件强盛极少,具备弧线表面和几那里理才干(NDS 目前没有原料表明有犹如才干),得到20% 的加成(参照T&L 加快器的加成状况)。

  前面说了,NDS与PSP的CPU 才干之比正在0.34-0.51 之间,那么部分以为他们的硬件总体才干之比正在0.283-0.425 之间,条件是软件拓荒商的顺序程度很高,能充实运用PSP的两个CPU ,不然这个比值还会上升。

  终末对NDS 异日的多媒体播放才干做个预测,目前任天国方面怒放的CPU 才干只到67MHz ,ARM9正在这个频率上念播放全屏幕的MPEG4 全体不或许(不操纵 播放君),但是参照多种203MHzARM 的PDA 播放MPEG4 的状况,拥有硬件加快的NDS 倘使就业正在200MHz,播放全屏幕的MPEG4 应当不存正在题目责编:侯健性能]嵌入式工程师解析NDS和PSP硬件真正能力