Inteli 45 nm protsessorid Penryn ja Nehalem: arhitektuuri iseärasused
Loe kommentaare (1)

Autor: Aleksandr Budik
Kuupäev: 09.05.2007 [09:00]
Sissejuhatus
Üks selle hooaja kõige intrigeerivamaid teemasid uudistes ja ajakirjanduses on Inteli 45 nm tootmistehnoloogiaga protsessorite väljalase. Vastavalt sellele, kuidas saabusid üksikasjad uute kiipide kohta, ilmus meie kodulehel hulk selleteemalisi kirjutisi. Täna püüame detailselt rääkida uute protsessorite uuendustest ja tehnoloogiatest. Üritame teha kokkuvõtte teoreetilistest arvutustest, millele järgnevad, teadagi, protsessorite tehniliste- ja jaemudelite praktilised katsetused.
Lähiaastate mikroarhitektuurid
Kõigepealt räägime lugejatele Inteli viimastest plaanidest protsessorite uute mikroarhitektuuride kasutuselevõtu kohta paari lähima aasta jooksul. Uue põlvkonna lauaarvutite protsessorid koodnimega Penryn ehitatakse täiustatud Intel Core´i mikroarhitektuuri baasil. Nende põhierinevuseks on üleminek 45 nm tootmisprotsessile ja mõned arhitektuurilised uuendused, mille tagajärjel tõuseb energiaefektiivsus, laieneb sageduspotentsiaal, suureneb täidetavate käskude hulk takti kohta ja muu seesugune.

Pärast Penryn kiipide masstootmise kordaseadmist, planeerib Intel esitleda protsessoreid koodnimega Nehalem (uue samanimelise mikroarhitektuuriga), mis tulevad Intel Core´i asemele. Umbes kaks-kolm aastat pärast 45 nm protsessorite esmaesitlust – umbkaudu aastatel 2009-2010, loodab Intel esitleda uut, veelgi täpsemat 32 nm tootmistehnoloogiat. Seni on need plaanid veel üsna ähmased: isegi üleminekuga 45 nm tehnoloogiale kaasnesid suured raskused ja see nõudis täiesti uute materjalide (high-k dielektrikud ja metallpaisud) koostoimimist. 32 nm tootmisprotsessi raames esitletakse protsessoreid koodnimega Westmere, mis olid varem tuntud kui Nehalem-C, sellesama Nehalemi mikroarhitektuuriga.
Kaks aastat pärast Nehalemi ilmumist, tuleb asemele mikroarhitektuur Gesher. Selle kohta on praegu veel väga vähe andmeid. On vaid teada, et esimesed Gesheri protsessorid toodetakse 32 nm tehnoloogiaga. Siinkohal lõppevad protsessorite edasise arenguga seotud prognoosid.
Otsustades nende plaanide põhjal, järgib Intel endist strateegiat – mikroarhitektuuride vaheldumine ja üleminek uuele tehnoloogiale iga kahe aasta tagant. Kas õnnestub protsessorite tööstuse liidril hoida nii kõrget arengutempot, on raske öelda. Intelis kutsutakse sellist tootmisprotsessi strateegiat „tick-tock” („tikk-takk”). Iga „tikk” kujutab uut pooljuhtide tootmistehnoloogia arenguetappi ja mikroarhitektuuri täiustamist (näiteks Penryn). Iga „takk“ tähendab uue mikroarhitektuuri loomist (näiteks Nehalem).
Täpsemalt Penryn-protsessoritest
Penryn´i perekonda kuuluvad protsessorid ilmuvad kronoloogiliselt enne Nehalemi, nendest alustamegi. Tänasel päeval on erinevates töötlusetappides üle 15 Penryn´i perekonda kuuluva toote. Esimeste seas näeme kiipe, mis on orienteeritud turu erinevatele sektoritele.
Senini oli teada, et valmistutakse välja laskma kahetuumalist protsessorit sülearvutitele, 2- ja 4-tuumalisi mudeleid lauaarvutite jaoks, samuti 2- ja 4-tuumalisi protsessoreid serverite turule. Tootearendajatele mõeldud Inteli Foorumi päevadel Pekingis saime teada firma plaanidest lasta välja 45 nm kiipe ka UMPC (Ultra Mobile PC) seadmetele. Uued protsessorid muutuvad väga nõutavaks ja võivad kõigutada selliste tootjate, nagu AMD, VIA Technologies jt. positsiooni.
Täiustusi, mida toob üleminek uuele tehnoloogiale, on huvitav vaadelda arvulisest küljest. Näiteks, neljatuumalised Penryn-protsessorid hakkavad sisaldama umbes 820 mln. transistorit, mis mahuvad ära kahele, 107 mm2 pindalaga kristallile. Võrdluseks: nüüdisaegsetes Inteli neljatuumalistes Kentsfield-protsessorites on 582 mln. transistorit, kusjuures 65 nm tehnoloogiaga valminud neljatuumaliste protsessorite kristallide pindala on 143 mm2.
Uuendusi, mida toob endaga protsessorite järgmine põlvkond, võib vaadelda seoses Inteli viie nüüdisaegse tehnoloogiaga: Wide Dynamic Execution, Advanced Smart Cache, Smart Memory Access, Advanced Digital Media Boost, Intelligent Power Capability.
Mehhanism Wide Dynamic Execution kindlustab suurema hulga käskude täitmise ühe taktitsükli jooksul. See suurendab tootlikust ja aitab saavutada suuremat energiaefektiivsust. Selle tehnoloogia raames pakub Intel täiustatud ja palju kiiremat jagamisplokki, mis põhineb metoodikal radix-16, samuti demonstreerib ta täiustatud virtualiseerimistehnoloogiat Enhanced Intel Virtualization Technology. Innovatiivne radix-16-põhine arhitektuur lubab oluliselt vähendada seisakuid arvukate jagamis- ning ka ujukomaoperatsioonide puhul. Alltoodud diagrammil näete kõnekaid tulemusi, mis ei vaja kommentaare.
Tehnoloogia Advanced Smart Cache ülesandeks on kindlustada vahemälu suuremat jõudlust ja efektiivsust. Intel otsustas suurendada Penryn-protsessorite perekonna vahemälu mahtu. Nii varustatakse kahetuumalised protsessorid L2 vahemäluga (mahutavus kuni 6 Mb), aga eraldiolevad neljatuumalised protsessorid saavad vahemälu 12-Mb. Sageduskarakteristika võtmeplaaniks on praegu 3 GHz ületamine.
Tehnoloogia Smart Memory Access raames räägitakse siini läbilaskevõime suurendamisest. Kinnituse saab info 1600 MHz sagedusega FSB-siini kasutuselevõtu kohta. Teatati, et 1600 MHz sagedusega FSB-siin ilmub mõnedesse tööjaama- ja serveriprotsessoritesse; praegu veel ei täpsustata, millal lastakse välja suure siinikiirusega mudelid lauaarvutitele.
Tehnoloogiat Advanced Digital Media Boost kasutatakse video-, kujutise- ja kõnetöötluse kiirendamiseks. Suurendamaks tootlikkust multimeediaandmete töötlemisel, otsustas Intel lisada ISA-arhitektuurile SSE4-multimeediakäsustiku (Streaming SIMD Extensions 4), mis muutub lauaarvutite turusegmendis kättesaadavaks 45 nm protsessorite ilmumisel. See uus käsustik sisaldab palju uuenduslikke instruktsioone (neid on umbes 50), mida võib tinglikult jagada kahte gruppi:
SSE4-st räägime lähemalt, kuna selle puhul on tehnoloogia üheks oluliseks uuenduseks. Kõigepealt kirjeldame rakendusi, mis on seotud selle täiustusega. Parendused puudutavad graafikat, video kodeerimist ja töötlust, kolmemõõtmeliste kujutiste loomist, mänge, veebi- ja rakenduseservereid. Intel kinnitab, et tõuseb suure arvutusintensiivsusega rakenduste (andmehoidlate analüüs, andmebaaside juhtimissüsteem, otsingu ja kõrvutuse keerulised tehted; heli, video, kujutiste ja andmete pakkimisalgoritmid, lauseanalüüsi arvutused ja loogiliste seisundite analüüs, samuti paljud teised) tootlikus.
Inteli sõnul on SSE4 kõige ulatuslikum ja olulisem Inteli ISA-arhitektuuri laienemine alates SSE2 kasutuselevõtust. Käsustik SSE4 sisaldab mitu kompilaatorite vektorisatsiooni primitiivi, mis kindlustavad multimeediarakenduste tootlikkuse ja efektiivsuse edasise suurenemise. Samuti on olemas uuenduslikud instruktsioonid ridade töötlemiseks.
Üheks täiustuseks on veel ümberpaigutusmehhanism Super Shuffle Engine. Uus plokk suudab ühe takti jooksul tähendusi ümber paigutada korraga terves 128-järgulises registris. See suurendab oluliselt ümberpaigutusega (pakkimine, lahtipakkimine, pakitud väärtuste nihe, sisestamine) seotud operatsioonide töötlemise tootlikkust. Taktikoguse võrdlus, mis on vajalik SSE baasoperatsioonide täitmiseks, on esitatud diagrammis. Siin võib märgata keskmiselt kahekordset tootlikkuse suurenemist.
Huvitavad uuendused on seotud võimsuse kasutustaseme vähendamisega ja näitaja „tootlikus vati kohta” suurendamisega. Sellega seoses esitles Intel kaht uut tehnoloogiat: Deep Power Down Technology ja Enhanced Dynamic Acceleration Technology.
Tehnoloogiat Deep Power Down Technology rakendatakse kõigepealt mobiilplatvormide protsessorites (Mobile Penryn). Energiatarbimise vähendamiseks lisati jõuderežiimi veel üks eriline protsessori seisund, mida nimetatakse Deep Power Down Technology State või siis C6. Selles režiimis on ette nähtud tuumade väljalülitus, sealjuures lülitub täielikult välja ka vahemälu. See võimaldab oluliselt madaldada tuuma pinget ja kasutatavat võimsust, mis omakorda pikendab aku tööaega.

Huvitav uuendus on ka tehnoloogia Enhanced Dynamic Acceleration Technology (EDAT). Selle idee on järgmine. Võtame lihtsuse mõttes näiteks kahetuumalise protsessori. Kuna ühe andmevooga rakendustes on mitmetuumalisusest vähe abi, mängib siin olulist rolli eraldi võetud tuuma tootlikkus. Sellepärast suurendas Intel töötava tuuma (non-idle core) sagedust, samal ajal, kui teine tuum (idle core) asub ühes jõudeseisundist (C3-C6) ja tema soojuseraldus väheneb järsult. Seda erinevust kasutab töötav tuum ja tõstab oma sagedust, kuni saavutab protsessori piirtaseme TDP. Piltlikuks näiteks toome järgneva illustratsiooni.

Nüüd räägime 45 nm protsessorite TDP tasemest. Kahjuks puuduvad praegu andmed mobiilsete kiipide soojuse eraldamise kohta. Lauaarvutite Kahetuumalised Penryn-protsessorid kuuluvad energiaklassi65 W, aga nende neljatuumalised sugulased on ette nähtud soojuspakettidesse 95 ja 130 W. Kahetuumaliste Inteli Xeon-protsessorite TDP-tasemed serveri segmendis on vastavalt 40, 65 ja 80 W, aga neljatuumalistel – 50, 80 ja 120 W.
Vastavalt Inteli sisetestidele on mängurakenduste puhul märgatud uute kiipide tootlikkuse 20-protsendilist kasvu, aga video dekodeerimisoperatsioonides (SSE4 kasutamisel) on tõus üle 40%. Kui võrrelda serveriprotsessorit Penryn, mille sagedus on üle 3 GHz ja kõige võimsamat neljatuumalist Xeon-protsessorit (Xeon X5355, 2,66 GHz, FSB 1333 MHz), siis intensiivselt ujukomaoperatsioone kasutavate ja läbilaskevõimele tundlikute rakenduste kasv moodustab umbes 45%.
Allikas: 3DNews - Daily Digital Digest

|
|