04-01-2010
Technologie: 32 nanometrowe procesory Intela
Technologie: 32 nanometrowe procesory Intela
Rok 2010 należy do Westmere’a
Tak przynajmniej wynika z procesorowych planów Intela. Pierwsze 32
nanometrowe układy o architekturze Westmere pojawiają się bowiem teraz – niemal
dosłownie z Nowym Rokiem. W sumie Intel wprowadza do sprzedaży osiem
32-nanometrowych procesorów z serii Core i5, cztery Core i3 oraz siedem nowych
chipsetów. Dodatkowo odmłodzona zostaje seria kości Core i7, w której pojawi się
siedem nowych mobilnych układów z serii i7-600. Te jednostki będą jednak w
dalszym ciągu wytwarzane w technologii 45 nm.
O 32-nanometrowych procesorach Intela o kodowej nazwie Westmere mówi się już
mniej więcej od roku. Patrząc tylko pod kątem samej architektury, kości Westmere
niewiele różnią się od 45-nanometrowych układów o kodowej nazwie Nehalem, czyli
procesorów Core i7 – patrz:
http://www.frazpc.pl/artykuly/633/Architektura/procesorow/Intel/Core/i7/(Nehalem)).
Na całą serię nowych jednostkach centralnych o architekturze Westmere składają
się tak naprawdę trzy mniejsze grupy układów o kodowych nazwach Gulftown, ta
rodzina przeznaczona jest do budowy serwerów i zaawansowanych stacji roboczych,
Arrandale – układy mobilne – oraz Clarkdale, czyli jednostki centralne dla
komputerów stacjonarnych. Jak można się domyślić, nowe układy wymagają też
nowych chipsetów – wraz z nimi w styczniu zadebiutowała seria kilku różnych
chipsetów z rodziny o kodowej nazwie Ibex Peak. Na rynku będą one sprzedawane
jako chipsety z serii Intel 5 – o czym za chwilę. Jako pierwsze pojawiły się na
rynku już teraz układy Arrandale oraz Clarkdale. Gulftown zadebiutuje zaś jako
ostatni, prawdopodobnie w drugim kwartale 2010 roku.

Rys.01 – Nowe rodziny procesorów, chipsetów i modułów sieciowych, które
pojawiły się na rynku na początku 2010 roku.
Źródło: Intel

Rys.02 – Procesory Arrandale (rząd układów u góry, po lewej standardowa
odmiana procesora mobilnego, obok nieco mniejsza kość w wersji ULV) oraz układ
Clarkdale wraz z odpowiednimi wariantami chipsetów Ibex Peak. Procesory i
chipsety zaprezentowane zostały w grudniu 2009 roku na specjalnie zorganizowanej
przez Intela w Monachium prapremierze procesorów wykonanych w technologii 32
nanometry.
Westmere od środka
Wróćmy jednak do budowy nowych układów Westmere. Przyglądając się bliżej ich
architekturze widać, że została ona, co prawda nieznacznie, ale jednak
zmodyfikowana. Niewątpliwie, najważniejszą zmianą to wbudowanie w układy
Arrandale i Clarkdale zintegrowanego modułu graficznego o kodowej nazwie
Ironlake. Procesory składają się z dwóch krzemowych układów umieszczonych na
jednej procesorowej płytce. Mniejszy z nich (81 mm2) to wykonany w technologii
32 nanometrów procesor klasy Westmere, drugi, nieco większy (114 mm2) to kość
graficzna Ironlake wytworzona w starszej bo 45-nanometrowej technologii.
Taki „sklejony” z dwóch krzemowych elementów procesor nazywany jest procesorem
umieszczonym w obudowie typu MCM – Multi Chip Module. Jak łatwo się domyślić,
technologia MCM daje większą elastyczność w produkcji procesorów. Różne wersje
rdzeni produkowanych w technologii 32 nm łatwo będzie łączyć z różnymi blokami
np. graficznymi (o większej lub mniejszej wydajności) lub bez nich, a także do
wytwarzania procesorów z, powiedzmy, pamięcią cache L4 bądź dodatkowymi
kontrolerami. Bez trudu można też wykorzystać te same jądra do produkcji
jednostek centralnych z dwu jak i trójkanałowymi kontrolerami pamięci DDR3, a
nawet, jeśli zajdzie taka potrzeba, DDR2 czy pamięcią graficzną GDDR.

Rys.03 – Architektura i fizyczne rozmieszczenie modułów wykonawczych w
procesorach Westmere i modułach graficznych Ironlake.
Źródło: Intel
Jak podaje producent, procesor do komputerów stacjonarnych Clarkdale składa się
z 383 mln tranzystorów, a układ graficzny Ironlake ze 117 milionów tranzystorów.
Co ciekawe, w strukturze modułu graficznego znalazł się również kontroler
magistrali PCI Express oraz elementy klasycznego mostka północnego, jak
kontroler pamięci (dla przypomnienia, w Nehalemie jest on umieszczony
bezpośrednio w strukturze krzemowej jądra procesora). Dodatkowo, zarówno w
procesorze jak i w układzie graficznym znalazł się interfejs MCP (MCP Interface
– Multi-Chip Package Interface), służący do bezpośredniej komunikacji układu
graficznego ze znajdującymi się na drugim kawałku krzemu z rdzeniami procesorów.
Przyglądając się nieco dokładniej rysunkowi 3 i występującym na nim opisom
modułów, można wyjaśnić nurtującą wiele osób zagadkę dotycząca zadania jednego
ze zintegrowanych w strukturze procesorów Nehalem/Westmere kontrolerów
oznaczanych na wielu publikowanych w Internecie schematach architektury
procesorów (np. patrz: Rys.04), symbolem Misc IO (ang. Misc = miscellaneous,
czyli różny, rozmaity). Jak się okazuje, pod tym oznaczeniem ukrywał się
interfejs MCP pozwalający na łączenie i komunikację rdzeni procesora z innymi
elementami struktury sytemu zamontowanymi na tej samej procesorowej płytce PCB,
takimi jak np. moduł graficzny.

Rys.04 – Modułowa architektura Nehalem pozwoliła na łatwe dołączenie do
struktury układu modułu graficznego i stworzenie różnych rodzin procesorów w
zamyśle projektantów lepiej dopasowanych do odmiennych potrzeb użytkownika.
Źródło: Intel
Ironlake, czyli wędrówka grafiki z chipsetu do procesora
Skoro jesteśmy już przy zintegrowanym z CPU module graficznym to zostawmy teraz
na chwilę sam procesor i przejdźmy do omówienia jednostki graficznej montowanej
w 32-nanometrowych układach Clarkdale i Arrandale. Jak już wspomniałem, zgodnie
z przyjętymi założeniami konstrukcyjnymi, moduł graficzny wraz z kontrolerem PCI
Express przeniesiony został z chipsetu płyty głównej do procesora. Moduł ten
jest unowocześnioną i zmodyfikowaną wersją dostępnych w chipsetach modułów
graficznych Intel GMA X4500HD spotykanych m.in. w chipsecie P45. Dzięki temu
zabiegowi wraz z wymianą procesora na nowszy, szybszy model będzie można
jednocześnie zwiększyć wydajność zintegrowanego układu graficznego (oczywiście,
jeżeli takowy będzie się znajdował w nowym CPU). Dotychczas w wypadku
zintegrowanej grafiki umieszczonej w chipsecie płyty głównej nie było to możliwe
bez wymiany płyty głównej, co niejednokrotnie wiązało się z wymianą praktycznie
niemal całej platformy i tańszych komputerach, w których nie montuje się
dyskretnych kart graficznych było po prostu nieopłacalne.

Rys.05 – Zmiany w platformie systemowej związane z przeniesieniem modułu
zintegrowanej grafiki z chipsetu do procesora.
Źródło: Intel
Projektując nowy układ graficzny inżynierowie z Intela skupili się przede
wszystkim na poprawie właściwości odtwarzania i przetwarzania materiałów wideo.
Jak pokazują badania rynkowe, komputery ze zintegrowaną grafiką bardzo często
wykorzystuje się bowiem do oglądania filmów czy przetwarzania materiałów wideo,
a znacznie rzadziej do grania. Najważniejsze zmiany, co oczywiste, dotyczą
odtwarzania i poprawy jakości materiałów HD i dekodowania strumienia wideo z
dysków Blu-ray. Wprowadzono miedzy innymi wymaganą w specyfikacji standardu
Blu-ray 1.1 możliwość jednoczesnego dekodowania dwóch sygnałów HD (DVD – Dual
Video Decode), a następnie wyświetlania jednego z nich „w obrazie” (PiP –
Picture In Picture). Nowy moduł graficzny potrafi też przetwarzać
postprocesingowo obraz wykorzystujący przestrzeń barwną xvYCC, która jest 1,8
razy większa niż przestrzeń barw sRGB. Nie zapomniano również o obsłudze
symultanicznej dwóch złączy HDMI i obsłudze 12-bitowej głębi kolorów na każdy
kanał, a nie jak to było wcześniej jedynie głębi 8-bitowej.

Rys.06 – Porównanie możliwości przetwarzania materiałów wideo dla
zintegrowanych układów graficznych Intela nowej i poprzedniej generacji.
Źródło: Intel
Jeśli chodzi o możliwości generowania obrazu 3D w grach, to niewiele się one
różnią w stosunku do poprzednika. Zwiększono nieznacznie szybkość taktowania
układu z 800 do 900 MHz. Dodano dwa potoki renderujace oraz zapewniono wsparcie
dla bibliotek OpenGL 2.1. Zaskoczeniem jest natomiast brak obsługi DirectX w
wersji 10.1, co wynika z wciąż realizowanych na drodze emulacji w sterownikach
przez procesor części operacji werteksowych i braku zunifikowanych shaderów.

Rys.07 – Porównanie możliwości generowania obrazu 3D dla zintegrowanych
układów graficznych Intela nowej i poprzedniej generacji.
Źródło: Intel
Ciekawą funkcją zaimplementowana w układzie graficznym Ironlake montowanym w
procesorach mobilnych Arrandale jest możliwość przełączania „w locie” bez
restartu komputera urządzenia wyświetlającego obraz pomiędzy zintegrowanym
modułem graficznym i dyskretnym notebookowym akceleratorem 3D (jeśli laptop w
takowy został wyposażony). Funkcja ta pozwala na zaoszczędzenie energii jeśli w
danej chwili nie jest wymagana maksymalna wydajność 3D. Notebook wykorzystuje
wówczas znacznie bardziej energooszczędny zintegrowany moduł graficzny, a jeśli
użytkownik zaczyna np. grac w wymagająca grę, system przełącza się na
wydajniejszy, dyskretny akcelerator. Co ważne, przełączanie „w locie” działa
niezależnie od modelu i producenta zewnętrznej karty graficznej. Obecnie takie
sprzętowe przełączanie działa w systemach Windows 7 i Windows Vista.

Rys.08 – Przełączanie wyświetlania grafiki „w locie”.
Źródło: Intel

Rys.09 – Nowy panel kontrolny dla zintegrowanych układów graficznych Intela.
Źródło: Intel
AES czyli mocne szyfrowanie
Z punktu widzenia użytkowników biznesowych najważniejszą nowością wprowadzoną we
wszystkich procesorach z rodziny Westmere jest pojawienie się w nich sprzętowego
wspomagania kodowania AES (Advanced Encryption Standard). Do zestawu instrukcji
SSE dodano sześć nowych instrukcji kodujących i dekodujących – AES-NI (AES-New
Instructions). Pozwalają one na bieżąco szyfrować dane przesyłane przez sieć,
informacje przechowywane na dysku twardym czy rozmowy VoIP. Możliwości te
zaprezentowano miedzy innymi na tegorocznym IDF-ie, gdzie pokazano notebooki z
najnowszymi 32-nanometrowymi układami Arrandale. Dzięki wprowadzeniu
rozszerzenia listy rozkazów AES-NI, procesory zgodne z architekturą x86
obsługują już ponad 700 instrukcji.

Rys.10 – Zastosowanie instrukcji AES.
Źródło: Intel

Rys.11 – Instrukcje AES-NI.
Źródło: Intel
Wprowadzone w Westmere’ach sześć instrukcji AES-NI stanowi część planowanego w
kolejnej generacji układów Intela o kodowej nazwie Sandy Bridge większego
rozszerzenia instrukcji SSE w architekturze x86 o nazwie AVX (Advanced Vector
Extensions). Model AVX oficjalnie zaprezentowany został już na początku 2008
roku. W zestawie AVX wprowadzono nowe, dwa razy szersze, 256-bitówe rejestry,
których łącznie jest 16. Są to rejestry oznaczone symbolami od YMM0 do YMM15. W
zestawie dodano 19 nowych instrukcji wektorowych oraz dołączono rozkazy
czteroargumentowe (łącznie 12 instrukcji tego typu) służące do akumulowania
wyników mnożenia wektorów.
Co ciekawe, rozszerzona została również możliwość kodowania rozkazów. Nowe
układy będą w stanie wykonywać część z dostępnych rozkazów SSE zarówno w
wariancie trzy- bądź czteroargumentowym (obecnie rozkazy mogą być jedynie
dwuargumentowe), co w znaczący sposób przyspieszy wykonywanie operacji
strumieniowych. Łącznie specyfikacja AVX przewiduje dodanie 291 rozkazów.
Interesujące jest to, że 166 nowych instrukcji zapożyczono wprost z procesorów
RISC, co sprawi, iż szybciej wykonywane będą również operacje skalarne na
pojedynczych danych, a rozszerzenie rejestrów będzie przymiarką do wprowadzenia
architektury 128-bitowej. Niestety, na pełną implementację AVX w układach Intela
przyjdzie nam poczekać przynajmniej rok.
Pozostałe funkcje
To tyle, jeśli chodzi o najważniejsze zmiany w procesorach Westmere. Podobnie
jak układy Core i7, wszystkie 32-nanometrowe procesory Intela obsługują
technologię współbieżnej wielowątkowości Hyper-Threading. Zaimplementowano w
nich także dobrze już znane technologie i rozszerzenia listy rozkazów MMX, SSE,
SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, Enhanced Intel SpeedStep Technology (EIST),
EM64T, XD bit, TXT (Trusted Execution Technology) oraz, co oczywiste, techniki
sprzętowej wirtualizacji Intel VT-x, Intel VT-d. Inżynierowie projektujący układ
zaimplementowali dla pamięci cache L3 również technologię Smart Cache, czyli
technikę z inteligentnej obsługi pamięci współdzielonej cache.
Kilka słów warto poświęcić technologii Turbo Boost, a wiec technice dynamicznych
zmian częstotliwości pracy poszczególnych rdzeni procesora w zależności od ich
obciążenia i globalnego zużycia mocy układu oraz wydzielanego ciepła.
Technologia ta zadebiutowała w procesorach Nehalem, ale teraz została
rozszerzona również na zintegrowany na procesorowej płytce PCB rdzeń graficzny.

Rys.12 – Działanie technologii Turbo Boost w procesorach Westmere.
Źródło: Intel
Jak pamiętamy, korzystając z funkcji Turbo Boost procesor może się sam
automatycznie przetaktowywać, zachowując przy tym założoną przez projektantów
wartość współczynnika termicznego TDP. Podczas takiego overclockingu każdy z
rdzeni może być przy tym niezależnie spowalniany lub wyłączany, a prędkość
zegarów taktujących pozostałe rdzenie jest w tym czasie podniesiona o kilka do
kilkunastu procent. Zabieg ten pozwala zwiększyć wydajności przetwarzanych na
nich zadań, a cały procesor, dzięki zatrzymaniu lub spowolnieniu jednego lub
nawet kilku rdzeni zachowuje określony przez projektantów bezpieczny dla
trwałości układu ogólny bilans cieplny. W układach Westmere bilansować musi się
również pod względem TDP część graficzna procesora. Oznacza to, że jeśli bardzie
obciążony jest moduł akceleratora 3D, wówczas on jest przyspieszany, jeżeli zaś
więcej mocy obliczeniowej potrzebuje procesor, to wówczas spowalniany jest mniej
używany w danej chwili rdzeń graficzny. Dotyczy to jednak jedynie wersji
procesorów mobilnych Arrandale.

Rys.13 – Rozszerzenie działania Turbo Boost na część graficzną układu
Westmere.
Źródło: Intel

Rys.14 – Scenariusze działania inteligentnego systemu dzielenia zasilania dla
poszczególne fragmentów układu Westmere.
Źródło: Intel
Ibex Peak
Oczywiście nowe procesory, które sprzedawane będą pod handlowymi nazwami
Core i5 i Core i3 wymagają nowych chipsetów i nowych podstawek (LGA 1156) – co
związane jest z przeniesieniem części funkcji mostka północnego bezpośrednio do
CPU – patrz: Rys.05.
Jednocześnie z nowymi procesorami Intel wprowadza nową serię chipsetów pod
kodową nazwą Ibex Peak. Są to odpowiednio układy o handlowych nazwach Q57, H57 i
Q55 dla procesorów Clarksdale i QS57, QM57, HM57 i HM55 dla mobilnych kości
Arrandale. Czym różnią się poszczególne układy widać na zamieszczonych poniżej
rysunkach.

Rys.15 – Najważniejsze właściwości chipsetów z serii Intel 5.
Źródło: Intel

Rys.16 – Różnice dotyczące chipsetów Ibex Peak dla desktopów.
Źródło: Intel

Rys.17 – Różnice dotyczące chipsetów Ibex Peak dla notebooków.
Źródło: Intel

Rys.18 – Schemat blokowy chipsetu Intel H55 Express.

Rys.19 – Schemat blokowy chipsetu Intel H57 Express.

Rys.20 – Schemat blokowy chipsetu Intel Q57 Express.
Co wchodzi na rynek
W styczniu na rynek trafi w sumie sześć 32-nanometrowych procesorów mobilnych
(cztery modele Core i5 oraz dwa Core i3) oraz również sześć kości Clarkdale
(również cztery modele Core i5 i dwa Core i3). Dodatkowo pojawią się także
jeszcze 45-nanometrowe układy mobilne z rodziny Core i7 ze starszym jądrem
Nehalem.

Rys.21 – Nowe procesory mobilne Intela z serii Core i7, Core i5 oraz Core i3.
Źródło: Intel

Rys.22 – Nowe procesory stacjonarne Intela z serii Core i5 oraz Core i3.
Źródło: Intel
Wraz z procesorami i chipsetami będzie można również zaopatrzyć się w nowe płyty
główne wytwarzane przez różnych producentów. Intel przygotował też własne
płytowe konstrukcje. Łatwo je rozpoznać po umieszczonych na nich złączach
graficznych PCI Express. Jak można się domyślić, układ graficzny umieszczony w
procesorze bez trudu można wyłączyć korzystając z odpowiedniej opcji w BIOS-ie
płyty głównej i zainstalować wówczas w komputerze dowolną, dyskretna kartę
graficzną dowolnego producenta.

Rys.23 – Różnice miedzy płytami głównymi Intela dla stacjonarnych procesorów
Core i5 oraz Core i3.
Źródło: Intel

Rys.24 – Nowa płyta dla procesorów Core i3 i Core i5 ze złączem LGA 1156 i
slotem PCI Express 16x

Rys.25 – Najważniejsze cechy funkcjonalne nowych płyt głównych Intela.
Źródło: Intel
Co nieco o wydajności
Na zakończenie prezentacji architektury Westmere’ów chciałbym kilka słów
poświecić wydajności nowych układów. Według Intela są one szybsze, oczywiście w
zależności od testu, średnio około dwóch razy w stosunku do odpowiadającej im
kości poprzedniej generacji dla komputerów mobilnych i blisko trzy razy dla
stacjonarnych. Producent zilustrował to wieloma przekazanymi dziennikarzom
przykładami. Poniżej prezentujemy kilka z nich.

Rys.26 – Porównanie wydajności procesorów nowej generacji.
Źródło: Intel

Rys.27 – Wyniki testy PCMark Vantage dla notebooków.
Źródło: Intel

Rys.28 – Wyniki testy PCMark Vantage dla desktopów.
Źródło: Intel
Do uzyskanych przez producenta rezultatów należy jednak podchodzić, jak zawsze,
ze znaczną ostrożnością. Oczywiście wyniki te sami zweryfikowaliśmy własnymi
testami przeprowadzonymi w naszej redakcji. Opis tych testów, nasze wrażenia
dotyczące działania nowej platformy oraz otrzymane przez nas rezultaty
przedstawiamy w osobnym artykule.
Autor: Marcin Bieńkowski
Komentarze (4) |