Eelmises artiklis oli juttu Inteli mikroarhitektuuri uue põlvkonna Nehalem põhieripäradest ning Inteli esimestest kuuetuumalistest protsessoritest Dunnington. Nüüd tuleb juttu samuti huvitavast uudistootest – mitmetuumalisest GPGPU-protsessorist Larrabee.
Selle aasta teisel poolel plaanib Intel lasta välja serveritele ja tööjaamadele mõeldud protsessorid Tukwila, mis saavad tootesarja Itanium esimesteks neljatuumalisteks esindajateks. Peale selle püstitavad uue põlvkonna kiibid omapärase rekordi, ehk saavad tööstusharu esimesteks mikroprotsessoriteks, millel on umbes kaks miljardit transistorit.
Perfektsionistidele märgime, et täpsemalt öeldes on neljal tuumal "ainult" 450 miljonit transistorit, teised transistorid jagunevad süsteemiliidese (umbes 157 miljonit transistorit), sisend/väljund alamsüsteemi (39 miljonit) ning vahemälu (1,42 miljardit transistorit) vahel. Muide, vahemälus pole juhuslikult lõviosa transistoritest, kuna selle üldmaht hakkab olema 30 MB. Sellise suure hulga pooljuhtelementide juures on "miljardärist" protsessori korpuse mõõtmed 21,5x32,5 mm (peaaegu 700 mm2).
Intelis kinnitatakse, et Tukwila lahenduse tootlikkus on nüüdisaegsete kahetuumaliste protsessorite Montvale (sari Itanium 9100) omast üle kahe korra suurem. Täpne info protsessorite Tukwila taktsagedustest puudub veel, kuid veebruarikuus toimunud konverentsil ISSCC 2008 (International Solid State Circuits Conference) olid Inteli esindajad rääkinud 2 GHz-se piiri alistamisest, samal ajal kui nüüdisaegsete kahetuumaliste protsessorite Itanium sagedused ei ületa 1,66 GHz. Mis puudutab TDP taset, siis (vastavalt viimastele andmetele) on Tukwila´l see 130 W. Võrdluseks: kahetuumaliste lahenduste Itanium (Montvale) soojuspakett on 104 W.
Tuleb märkida, et palju täpsemale tootmisprotsessile ülemineku tõttu on õnnestunud suurendada energiasäästlikkust. Praegu toodetakse protsessoreid Itanium 90-nm tootmistehnoloogia alusel, samal ajal kui Tukwila lahendused saavad kasutada 65-nm tootmistehnoloogia kõiki eeliseid. Samuti on soodustanud energiatarbe vähendamist skeemitasemel toimunud muudatused, mis lubasid vähendada toite tööpingeid. Toome tarbitava pinge ja toitevõimsuse ligikaudsed näitajad protsessorite Tukwila põhikomponentidele:
- tuumad: 0,9-1,15 V/100 W
- süsteemiliides: 0,9-1,15 V/30 W
- vahemälu: 1,1 V/20 W
- sisend/väljund alamsüsteem: 1,1 V/20 W
Tukwila põhieripäradest võib märkida uut ülikiiret süsteemisiini QuickPath Interconnect (rääkisime sellest eelmises osas), kaht integreeritud mälukontrollerit, kahe andmevoo samaaegset töötlemisvõimalust (tehnoloogia Simultaneous Multi-Threading). Sellega kõrvuti on oodata hoolduse töökindluse, -valmiduse ja -mugavuse tagamise kõrgtasemeliste funktsioonide tuge (RAS, Reliability, Availability and Serviceability), muuhulgas funktsiooni DDDC (Double Device Data Correction), mis lubab mälul edasi töötada juhul, kui dünaamilise operatiivmälu kahel järjestikulisel moodulil on tekkinud tõsised riistvaralised vead ning programmivigade tekkimissageduse (SER, Soft Error Rate) säilitamist samal tasemel (vaatamata loogikaelementide hulga kolmekordsele kasvule).
Kahjuks puuduvad veel andmed konkreetsetest mudelitest ja ligikaudsetest hindadest.
Intel AVX – vektorkäskude komplekt uue põlvkonna CPU-le
Sellel aastal esitleb Intel oma uut protsessorite mikroarhitektuuri Nehalem. Kahe aasta pärast (vastavalt niinimetatud tikk-takk arengumudelile) toimub Intelis järjekordne asendus – Nehalemi asemele tuleb arhitektuur Sandy Bridge (varem tuntud kui Gesher). Vaatamata sellele, et see nimi "särab" juba päris kaua Inteli esitlusslaididel, on andmeid temast veel päris vähe.
Hiljuti rääkis Patrick Gelsinger lühidalt vektorikäskude AVX (Advanced Vector Extension) uuest komplektist, mida juurutatakse mikroarhitektuuriga Sandy Bridge 32-nm protsessoritesse. Inteli esindaja kinnitusel lubab käskude AVX kasutamine suurendada kiiretoimelisust ujukomaga tehingutes, multimeedia ülesannetes ja rakendustes, mis koormavad kõvasti protsessorit. Peale selle aitavad uued vektorilaiendused suurendada protsessorite energiasäästlikkust.
AVX-i üks põhieripära on registrite sõnapikkuse suurenemine 128 bitilt 256 bitini, mis (Inteli kinnitusel) lubab kahekordistada ujukomaga tehtavate operatsioonide maksimaalset hulka sekundis (FLOPs). Samuti märgitakse andmete ümbergrupeerimise meetodite täiustamist (lubavad kiirendada nende töötlust) ja nn rikkumata süntaksiga (non-destructive syntax) kolmeoperandiliste käskude tuge (lisab sellised eelised nagu registrimälu efektiivsem kasutamine ning programmikoodi mahu vähendamine).
Larrabee – visuaalarvutuste arhitektuur
Suurem osa märtsis toimunud Inteli pressikonverentsist oli pühendatud visuaalarvutuste uuele arhitektuurile Larrabee. Kuid enne, kui alustada selle kirjeldamist, tuleks tutvuda kontseptsiooniga Visual Computing, mis muudab arvutigraafika traditsioonilise mõiste.
Patrick Gelsinger selgitab, et järgmise põlvkonna tehnoloogiad, mis lubavad luua veel realistlikumaid mänge, taasesitada suure teravusega pilte, videot ja heli, suurendavad oluliselt personaalarvuti arvutusvõimsusele esitatavaid nõudeid. Näiteks üldise valgustusmeetodi (nagu kiirte trasseerimine, mida kasutatakse varjude ja valgusefektide täpsemaks edastuseks) kasutamine. Arvutusvõimaluste nõuete uus tase kehtestab käitumisrealismi kasutamise programmilisades (näiteks füüsikaarvutused mängudes).
Samuti ennustab Intel interaktiivsuse täiesti uusi tasemeid. Näiteks on järgmise põlvkonna mängukontrollerid võimelised "mõistma" inimese liikumist ning andma virtuaaltegelastele tema iseloomu. Meditsiinis hakatakse aktiivselt juurutama arvutijuhtimisel interaktiivprotseduuride süsteeme, mida määratakse pärast reaalajas saabunud patsiendi seisundiinfot.
Kõigeks selleks läheb tarvis uue taseme võimsat arvutusplatvormi, millel on mitmetuumaline protsessor, kiibistik, graafikaalamsüsteem, samuti tarkvara ja vastavad paketid arendajatele (SDK, Software Development Kit).
Investeerides jätkuvalt suuri summasid kontseptsiooni Visual Computing arengusse, töötab Intel välja arhitektuuri Larrabee, mis kujutab endast visuaalarvutuste järgmist arenguetappi. Nagu märgitakse, esitletakse uue arhitektuuri baasil töötava esimest toodet selle aasta lõpu poole.
Kontseptsioon Larrabee sisaldab kõrgtootliku SIMD (Single Instruction Multiple Data) vektorprotsessori (VPU, Vector Processing Unit), samuti vektorijuhendite uue komplekti, kuhu kuuluvad käsud tööks täisarvu- ja asioperandidega, vektoroperatsioonid mäluga, tingkäsud. Peale selle näeb Larrabee ette vahemälu koherentsuse uue analüüsiskeemi (tähtis funktsioon mitmetuumalistes süsteemides).
Märgitakse võimalust programmeerida lahendusele suurt hulka arvutusülesandeid (üldotstarbega ülesanded), seega saab põhimõtteliselt protsessorit Larrabee nimetada GPGPU klassi (General Purpose Graphical Processor Unit) protsessoriks, ehkki firma ise ei kasuta seda mõistet oma ametlikes avaldustes. Märgime, et GPGPU idee on juba teostatud graafikakaartide põhiarendajate toodetes. Näiteks edutab AMD turul oma tehnoloogiat Stream Computing, NVIDIA-l on aga varuks arhitektuur CUDA.
Kahjuks pole Inteli esindajad avaldanud Larrabee riistvara eripärasid, seepärast tuletame lühidalt meelde põhilised, praegu teada olevad andmed, mis olid välja kuulutatud firma eelmistel esitlustel.
Larrabee lahendusi hakatakse tootma 45-nm tootmisprotsessiga. Kiibid (mõõdud 49,5x49,5 mm) sisaldavad 16-24 tuuma, mis on võimelised töötlema nelja andmevoogu korraga. Eeldatakse, et taktsagedused on vahemikus 1,7-2,5 GHz (vastavalt mõnedele andmetele kuni 2 GHz), seejuures on TDP tase vähemalt 150 W.
Igal tuumal on 32 KB esimese taseme vahemälu (latentsus üks takt), samuti L2 vahemälu, mille maht on 256 KB ja latentsus 10 takti. Peale selle on kiibis kaks mälukontrollerit ja tekstuuri lugemisplokid. Tõsi, "lihtsustatud" esitlusslaidil (toodud allpool) pole neid komponente. GPGPU-protsessorite tootlikkust ujukomaga operatsioonides hakatakse mõõtma teraflopsides.
Muide, kuivõrd võimas ja funktsionaalne poleks riistvara, ilma efektiivse tarkvarata muutub see vanarauaks. Sellest suurepäraselt aru saades, üritatakse Intelis pöörata vastavat tähelepanu programmeerijate töövahendite arendusele. Lisaks traditsioonilistele pakettidele (MPI Library, Thread Checker, Thread Profiler ja muud) esitleb Intel Larrabee lisatarkvara. Uus arhitektuur hakkab toetama nüüdisaegseid API DirectX-i ja OpenGL-i.

Lõppsõna
Inteli uuringute valdkond on niivõrd lai, et pole ühe artikli raames võimalik põhjalikult tutvuda pooljuhtharu hiiglase kõikide nüüdisaegsete arendustega. Meil seisab veel ees tutvus firma viimaste arendustega: protsessorid Tolapai (klass "süsteem kiibil"), hiljuti eelteatatud minikiibid Atom, virtualiseerimise uued tehnoloogiad, integreeritud süsteemide lahendused.
Teemakohased materjalid:
Infoallikad, mida kasutati artikli ettevalmistamisel:
Justin Rattner. 2008 ISSCC Intel Paper Highlights
Intel Technology Journal, Volume 11, Issue 3, August 22, 2007