06-07-2009
Czas 32 nanometrów
Procesory Intela produkowane w 32-nanometrowym procesie technologicznym
Czas 32 nanometrów
Pod koniec tego roku pojawią się w sklepach pierwsze 32-nanometrowe procesory
Intela o kodowej nazwie Westmere. Mają one docelowo zastąpić wszystkie obecnie
wytwarzane 45-nanometrowe modele układów tego producenta. Spróbujmy zatem
odpowiedzieć na pytanie, czy szykuje się nam kolejna procesorowa rewolucja, czy
też może nadchodzące zmiany są zmianami ewolucyjnymi.
Nieco więcej o układach Westmere usłyszeliśmy na początku lutego, kiedy to Intel
po raz pierwszy oficjalnie zaprezentował działające próbki procesorów
wytworzonych w nowej, 32-nanometrowej technologii produkcji.

Źródło: Intel
Na zdjęciu prezentowany jest jeden z
pierwszych 32-nanometrowych procesorów Westmere. Na jednej procesorowej płytce drukowanej
znajdą się dwa krzemowe układy. Pierwszy z nich to wielordzeniowe jądro
procesora, drugi to moduł karty graficznej, kontrolera pamięci i zintegrowane z
nimi elementy mostka północnego.

Koncepcja dwuukładowego procesora Westmere - Źródło: Intel
Intel na przygotowania do produkcji
procesorów w nowej 32-nanometrowej technologii zamierza wydać ogromne pieniądze,
nie licząc się praktycznie z panującym na świecie kryzysem. Wydane kwoty na
inwestycje technologiczne należą bowiem do jednych z największych w
dotychczasowej historii Intela. Jak ujawnił prezes i dyrektor generalny Intela
Paul Otellini, aby przygotować zakłady półprzewodnikowe w samych tylko Stanach
Zjednoczonych do przejścia na 32-nanometrową technologię produkcji układów
scalonych w latach 2009-2010, Intel zainwestuje około 7 mld dolarów. Pod koniec
tego okresu kwota ta może zostać zwiększona o kolejny miliard dolarów.

Źródło: Intel
Do produkcji w 32-nanometrowym procesie
technologicznym, oprócz działającej już oregońskiej fabryki D1D mają zostać
przygotowane trzy kolejne zakłady znajdujące się w Oregonie, Nowym Meksyku i
Arizonie.
Te olbrzymie, nawet jak na warunki przemysłu
półprzewodnikowego, inwestycje związane są przede wszystkim z wymianą sprzętu
wykorzystywanego do litografii. Niełatwe jest też odpowiednie dostrojenie linii
produkcyjnych do tej nowej, bardzo wymagającej technologii. Podczas wdrażania w
oregońskiej fabryce D1D technologii 32-nanometrowej, inżynierowie z Intela po
raz pierwszy zdecydowali się zastosować litografię immersyjną do wytwarzania
kluczowych elementów procesora. Jak trudna jest to technologia może świadczyć
fakt, że w konkurencyjnej, drezdeńskiej fabryce AMD, zdecydowano się ją wdrożyć
już przy procesie 45 nm, ale, jak pamiętamy, opóźnienia z nią związane były
znaczne i dopiero niedawno firmie AMD udało się rozpocząć masową produkcje
układów w tej technologii.
Co ciekawe, na potrzeby nowych, 32-nanometrowych układów Westmere inżynierowie z
Intela opracowali drugą, znacznie szybszą generacja tranzystorów CMOS o wysokiej
stałej dielektrycznej wykorzystujących metalową bramkę. Zgodnie z obowiązującymi
na świecie ekologicznymi trendami, obudowy nowych układów Westmere pozbawione
mają być też ołowiu i produkowane będą bez wykorzystywania halogenków metali.
Westmere od środka
Procesory Westmere to tak naprawdę, patrząc tylko i wyłącznie na samą
architekturę wewnętrzną, przeniesione do wymiaru 32 nm, 45-nanometrowe układy
Nehalem, obecne na rynku od listopada zeszłego roku pod handlową nazwą Intel
Core i7 (nazwa kodowa Nehalem – patrz: „Architektura
procesorów: Intel Core i7”). Dla przypomnienia, obecne na rynku układy
Core i7, są to układy z Nehalemowej podrodziny o kodowej nazwie Bloomfield.
Należą do niej procesory Core i7 z serii 900, czyli Core i7 920, 940, 950 oraz
Core i7 Extreme Edition 965 i 975. Według założeń producenta, układy Core i7
montowane w podstawce LGA1366 przeznaczone są przede wszystkim dla
najmocniejszych komputerów biurkowych i jednoprocesorowych stacji roboczych. Te
układy wyposażone są w 8 MB pamięci cache L3 typu Smart Cache oraz obsługują w
sposób trzykanałowy pamięć DDR3 (maksymalnie 24 GB pamięci RAM). Kości z tej
serii mają fizycznie po cztery rdzenie, z których każdy obsługuje technologię
współbieżnej wielowątkowości HyperThreading – tyle w skrócie.
Wróćmy jednak do budowy nowych układów Westmere. Przyglądając się bliżej ich
architekturze widać, że została ona, co prawda nieznacznie, ale zmodyfikowana –
i nie chodzi tu wyłącznie o zmiany związane z optymalizacją dotychczasowych
bloków wykonawczych, zmniejszeniem zużycia energii oraz poprawą szybkości
działania, tak jak się to czyni przy każdym kolejnym steppingu i zmianie
technologii wytwarzania. Podstawową różnicą dotyczącą rdzenia jest bowiem
wprowadzenie w układach Westmere siedmiu nowych instrukcji związanych z
przyspieszeniem działania algorytmów szyfrujących i odszyfrowujących dane. Jedna
zwiększa szybkość mnożenia 64-bitowych liczb binarnych, w którym nie uwzględnia
się przeniesień. Pozostałych sześć instrukcji to zaś specjalizowane rozkazy
przyspieszające proces szyfrowania i deszyfrowania danych algorytmem AES (Advanced
Encryption Standard).
Wszystkie nowe rozkazy są wektorowym rozszerzeniem zestawu instrukcji SSE4 o
nazwie AVX (Advanced Vector Extensions), które Intel opracował 2008 roku. Pełna
implementacja AVX obejmuje wprowadzenie 16. nowych 256-bitowych rejestrów
(zamiast 128-bitowych), 19 rozkazów 256-bitowych, 12 czteroargumentowych
instrukcji akumulujących wyniki mnożenia wektorów liczb zmiennoprzecinkowych,
dodanie specjalizowanych sześciu instrukcji wspomagających szyfrowanie AES,
możliwość wykonywania części rozkazów SSE (działających na wektorach liczb
zmiennoprzecinkowych) na 256-bitowych rejestrach oraz rozszerzone kodowanie
rozkazów, dzięki czemu można realizować rozkazy SSE w wariancie trzyargumentowym
lub czteroargumentowym, z możliwością wskazania docelowego rejestru, a nie jak
dotychczas dwuargumentowym z nadpisywaniem jednego argumentu.
Tych siedem nowych w Westmerze instrukcji jest jak gdyby forpocztą nadchodzących
zmian, gdyż pełna implementacja sprzętowa opisywanego powyżej rozszerzenia AVX
zapowiadana jest dopiero na 2010 rok. Wektorowe instrukcje AVX pojawią się
dopiero, według obecnych planów Intela, w układach o kodowej nazwie Sandy Bridge.
Procesory te zastąpią w przyszłości opisywane Westmere’y. Warto jednak, aby
programiści zaczęli z nich korzystać jak najszybciej. Przykładem wykorzystania
nowych zaimplementowanych w Westmerze rozszerzeń instrukcji SSE może być miedzy
innymi możliwość pełnego, sprzętowego szyfrowania „w locie” zawartości całego
dysku twardego, czy transmisji danych w sieciach P2P.

Procesorowe plany Intela na najbliższe lata. Źródło: Intel
Multu-Chip Module
Architektura Westmere’a, podobnie jak architektura Nehelema jest
architekturą modułową. Pozwala ona na dodawanie i odejmowanie poszczególnych
elementów funkcjonalnych układów w ramach dwóch grup core i uncore. Pierwsza
obejmuje poszczególne rdzenie procesora oraz zintegrowane z nimi moduły
pomocnicze. W sekcji uncore znajdują się pozostałe elementy funkcjonalne
procesora, w tym kontroler pamięci i pamięć cache L3.

Modułowa koncepcja budowy procesorów. Źródło: Intel
W wypadku Westmere’a mocno przeprojektowali
otoczenie układu. Dzięki temu można było fizycznie rozdzielić części core i
uncore. Pierwsza z nich wykonana będzie w technologii 32 nm, pozostała cześć
procesora będzie produkowana na oddzielnej płytce krzemowej w dotychczas
wykorzystywanym procesie 45 nm. Całość, jako dwa niezależne elementy krzemowe
montowane będą na jednej procesorowej płytce PCB – patrz: pierwsze dwa zdjęcia.
Taki podwójny moduł procesora nosi nazwę obudowy MCM – Multi-Chip Module.
Technologia MCM daje większą elastyczność w produkcji procesorów. Różne wersje
rdzeni produkowanych w technologii 32 nm łatwo będzie łączyć z różnymi blokami
uncore, np. te same jadra mogą być wykorzystane do produkcji zarówno procesorów
z wbudowaną karta graficzną jak i bez niej. Bez trudu można też wykorzystać je
do produkcji jednostek centralnych z różną pojemnością pamięci cache L3, jak i
dwu jak i trójkanałowymi kontrolerami pamięci DDR3, a nawet, jeśli zajdzie taka
potrzeba, DDR2.
Jak przewiduje Intel, procesory Westmere będą wyposażone w pamięć podręczną
cache L3 o wielkości 4 MB. Jest to mniej niż w wypadku kości Nehelem, które
wyposażone są w 8 MB pamięć cache L3. Pamięć ta, podobnie jak w poprzedniku
korzysta z technologii Smart Cache, która pozwala procesorom na przechowywanie w
niej danych w taki sposób, że każdy z rdzeni wielordzeniowego układu może
wykorzystać dla siebie bez ograniczeń pełną pojemność pamięci L3 (podczas braku
aktywności pozostałych rdzeni), bez konieczności przepisywania zawartości stron
do dedykowanej pamięci cache L2. Teraz jednak technologia ta ma być znacznie
bardziej wydajna. Ulepszono w niej przede wszystkim mechanizmy zarządzające
spójnością danych oraz poprawiono algorytmy przewidywania, które odpowiedzialne
są za pobieranie z wyprzedzeniem z pamięci RAM potrzebnych za chwilę rdzeniom
procesora danych niezbędnych do dalszych obliczeń.
Intel podkreśla też lepszą implementację technologii Turbo Boost, znanej
wcześniej pod nazwą Turbo Mode. Przypomnijmy, że jest to technika dynamiczne
zarządzająca zasilaniem i zegarem taktującym Westmere’a. Za pomocą funkcji Turbo
Boost procesor może się sam się przetaktować zachowując przy tym założoną przez
projektantów wartość współczynnika TDP. Każdy z rdzeni może być bowiem
niezależnie spowalniany lub wyłączany, a prędkość zegarów taktujących pozostałe
rdzenie jest w tym czasie podniesiona o kilka do kilkunastu procent. Zabieg ten
pozwala zwiększyć wydajność przetwarzanych na nich zadań, a cały procesor,
dzięki zatrzymaniu lub spowolnieniu jednego lub kilku rdzeni zachowuje zaś
bilans cieplny liczony jako całość dla krzemowego obwodu. W stosunku do Nehalema
zwiększono liczbę stanów wyłączania i przetaktowywania rdzeni.
Grafika w rdzeniu procesora
Najistotniejszą nowością wprowadzoną w układach Westmere, w stosunku do Nehalema
jest zintegrowanie w procesorze układu graficznego. Jak już wspomniałem znajdzie
się on w 45-nanometrowym module uncore wraz z kontrolerem pamięci i graficznym
kontrolerem szyny PCI Express, który umożliwi podłączenie zewnętrznej karty
graficznej.

Dwuukładowe rozwiązanie chipsetów dla platformy Westmere. Źródło: Intel
Patrząc pod katem architektury systemowej, w
rozwiązaniu platformy systemowej ze zintegrowaną grafiką, przeniesiony zatem
został moduł graficzny z chipsetu płyty głównej wprost do układu procesora.
Dzięki temu łatwiej będzie unowocześnić komputer biurowy zmieniając tylko samą
jednostkę centralną przy okazji unowocześniając układ graficzny, jeśli w nowym
modelu procesora znajdzie się nowszy akcelerator 3D.
O samym układzie graficznym wiadomo na razie tyle, że wywodzić się one będą
wprost z obecnie wykorzystywanego w chipsecie Intela G45 modułu graficznych
X4500HD. Jak można przeczytać w różnych nieoficjalnych źródłach (Intel ani nie
potwierdza ani nie zaprzecza tym informacjom), akcelerator pod względem
sprzętowym będzie zgodny z bibliotekami OpenGL 2.0 i Microsoft DirectX 10.1 oraz
modelem cieniowania Shader Model 4.1. Nieoficjalnie mówi się też o obsłudze
bibliotek DX 11 i OpenGL 3.0.
Możliwości generowania grafiki trójwymiarowej bez problemu powinny wystarczyć do
tego, aby uruchomili się interfejs graficzny Windows 7. Powinno też dać się
zagrać w większość starszych gier lub nowych tytułów, ale przy wyłączeniu części
efektów i zmniejszeniu rozdzielczości ekranu. Konstruując nowy moduł graficzny
inżynierowie Intela duży nacisk położyli na sprzętowe dekodowanie materiałów
wysokiej rozdzielczości HD. Dekodowane mają być pliki wideo w formatach AVC, VC1
i MPEG-2/4.
Wersje układu
Według oficjalnych, dostępnych na dzień dzisiejszy informacji, na rynek trafią
trzy serie 32-nanometrowych układów z rodziny Westmere. Będą to układy Gulftown,
Clarkdale i Arrandale. W 2010 roku wejdą do sprzedaży bazujące na Gulftownie
układy serwerowe.

Pierwsze zdjęcia układów Hevendale (45 nm) i Clarkdale (32 nm) z wbudowaną
grafiką i współpracujące z podstawką LGA 1156.
Układy Gulftown przeznaczone są do budowy
wydajnych desktopów i wydajnych, jednoprocesorowych stacji roboczych. Zastąpią
one obecnie produkowane układy Core i7 z rodziny Bloomfield (architektura
Nehalem) korzystające z podstawki LGA 1366. Układy Gulftown pozbawione będą
zintegrowanego modułu grafiki i sprzedawane będą w wersji sześciordzeniowej.
Najbardziej interesujące są układy o kodowej nazwie Clarkdale. Są to
dwurdzeniowe kości przeznaczone do typowych biurowo-domowych komputerów. Co
ciekawe będą one przeznaczone do montażu w nowej podstawce LGA 1156 obsługującej
procesory o handlowej nazwie Intel Core i5 i Core i3, o których to głośno już od
jakiegoś czasu – o czym za chwilę. Pod tą podstawkę przygotowywany były do
niedawna widoczny na zdjęciu powyżej jeszcze 45-nanometrowy (architektura
Nehalem), zawierający również układ graficzny Havendale, z którego to procesora
Intel ostatecznie zrezygnował, zastępując go od razu Clarkdale’m.

Procesory Intela w 2009 roku. Źródło: Intel
Podstawową architektoniczną różnicą, oprócz
innej podstawki i mniejszej liczby rdzeni, miedzy Gulftownem a Clarkdale’m jest
obecność w tym ostatnim modułu graficznego oraz dwu-, a nie trójkanałowego
kontroler pamięci DDR3. Wszystkie układy Westmere korzystają, oczywiście z
technologii HyperThreading, co podwaja widoczną w systemie operacyjnym liczbę
rdzeni i jednocześnie przetwarzanych wątków. Ostatnią kością z rodziny Westmere
jest mobilny, dwurdzeniowy Arrandale stanowiący część mobilnej platformy
Calpella.

Roadmapa procesorów Intela. Źródło: Intel
Jeśli chodzi o procesory serwerowe, to będą
one zgodne z obecnie wykorzystywaną architekturą Tylersburg-EP (Nehalem-EP).
Umożliwi to łatwą, co jest bardzo istotne z punktu widzenia firm, nie wymagającą
nakładów finansowych zmianę używanego serwera (wystarczy upgrade BIOS-u)
migrację do nowej platformy. Dopiero w 2010 roku pojawi się nowa serwerowa
platforma, dla najbardziej zaawansowanych maszyn – Boxboro-EX – korzystająca
wciąż na szczęście ze złącza LGA 1366.

Roadmapa procesorów serwerowych Intela. Źródło: Intel
Porównanie procesorów o architekturze
Nehalem i Westmere (źródło: Intel)
|
|
Segment rynku
|
Nehalem (45 nm)
|
Westmere (32 nm)
|
|
Desktopy
|
Klasy wyższej
|
Bloomfield (4C / 8T), LGA 1366, trzy kanały DDR3
|
Gulftown (6C / 12T), LGA 1366, trzy kanały DDR3
|
|
Do użytku masowego
|
Lynnfield (4C / 8T), LGA 1156, dwa kanały DDR3
|
Clarkdale (2C / 4T + iGFX), LGA
1156, dwa kanały DDR3
|
|
Komputery mobilne
|
|
Clarksfield (4C / 8T)
|
Arrandale (2C / 4T + iGFX)
|
|
Serwery
|
Rozszerzalne skalowalne (zwykle 4 i więcej gniazd)
|
Nehalem-EX (8C
/ 16T)
|
Przyszły procesor Westmere
|
|
Wydajne energooszczędne (zwykle 2 i więcej gniazd)
|
Nehalem-EP (4C
/ 8T)
|
Przyszły procesor Westmere
|
|
Klasy podstawowej (zwykle 1 gniazdo)
|
Lynnfield
(4C / 8T)
|
Clarkdale (2C / 4T + iGFX)
|
C – liczba rdzeni procesora
T – liczba obsługiwanych wątków programowych
iGFX – zintegrowany moduł graficzny

Z kolei chińska strona www.inpai.com.cn (http://www.inpai.com.cn/doc/hard/99368.htm)
uściśliła kilka dni temu informacje dotyczące nowego nazewnictwa procesorów
Intela. Według Inpai, platforma Core i3 będzie bazowała przede wszystkim na
podstawce LGA 775. Gulftown otrzyma zaś nową nazwę Core i9. Szczegóły podane
przez chiński serwis zobaczyć możecie w powyższej tabeli.
Nowe platformy,...
Wraz z nowymi procesorami, pod koniec roku zadebiutują też nowe chipsety,
oznaczane w tej chwili przez Intela chipsetami z serii Intel 5, a do niedawna
ukrywające się pod kodową nazwą Ibex Peak. Intel zamierza produkować układy z
rodziny Ibex Peak w trzech wariantach dla procesorów ze zintegrowanymi modułami
graficznymi. Są to odpowiednio układy oznaczone jako Q57, H57, H55 i będą
współpracowały ze złączem LGA 1156. W sprzedaży znajdzie się również nowy układ
z rodziny Ibex Peak, P57 i P55 ale przeznaczony, podobnie jak X58 do współpracy
z podstawką LGA 1366.

Architektura chipsetu Ibex Peak (Intel 5). Źródło: Intel
Jak już wcześniej wspomniałem z chipsetu
Ibex Peak znika jeden z układów, który pełni dotąd funkcję mostka północnego.
Jego zadania przejmuje bowiem w całości moduł znajdujący się w sekcji uncore w
procesorach Westmere.
...oznaczenia...
Wraz z pojawieniem się nowych chipsetów na rynku (już prawdopodobnie we
wrześniu) pojawi się też nowa rodzina procesorów oznaczona symbolem Intel Core
i5. Pierwszym przedstawicielem nowej serii układów, będzie jeszcze
45-nanometrowy Lynnfield, nazywany też Nehalemem dla mas, gdyż przeznaczony jest
do komputerów domowych. To jego na początku 2009 roku ma zastąpić/uzupełnić
Clarkdale, który być może będzie oznaczany też symbolem Core i3 – o czym za
chwilę.
Procesory Core i5 w stosunku do Core i7 mają się różnić nie tylko podstawką
(odpowiednio LGA 1156 i LGA 1366), ale przede wszystkim maja być wyposażone w
dwa kanały pamięci, które mogą obsłużyć moduły DDR3 o maksymalnej pojemności 16
GB. Płyty z chipsetami z rodziny Ibex Peak przeznaczonymi dla tych procesorów
mogą współpracować co najwyżej z dwoma gniazdami PCI Express x8 lub jednym
złączem PCI Express x16.
Nie unikniemy jednak bałaganu. Według niepotwierdzonych informacji Intel
najszybsze i najlepiej wyposażone czterordzeniowe wersje Lynnfielda, zamierza
również oznaczać jako Core i7, zaś procesory o ograniczonej funkcjonalności będą
sprzedawane jako Core i5. Mało tego czterordzeniowy 45-nanometrowy Clarksfield,
przeznaczony dla notebooków ma być również zaliczony do serii Core i7.
Jeśli chodzi zaś o dwurdzeniowe 32-nanometrowe układy Clarkdale’a i Arrandale’a,
będą prawdopodobnie zaliczone do rodziny Core i3, która ma nie tyle zastąpić, co
uzupełnić linię produktową Core i5, czyli Lynnfielda i Clarksfielda.
...i klasyfikacja
Nowy system nazewnictwa powiązany ma być w przyszłości bardzo mocno z
wprowadzanym od jakiegoś czasu systemem ocen od jednej do pięciu gwiazdek. Z
systemem gwiazdkowych ocen zapoznać się można już dziś pod adresem –
http://www.intel.com/consumer/rating.htm.

Gwiazdkowy system oceny funkcjonalności i mocy obliczeniowej procesorów Intela.
Przyszły system nazewnictwa ma więc
zawierać więcej informacji o funkcjonalności układów i względnej wydajności niż
o taktowaniu i wewnętrznej konstrukcji. Może się więc szybko okazać, że
oznaczenia te będą bardzo mylące dla osób podejmujących decyzje o kupnie danego
modelu na podstawie danych technicznych, takich jak liczba rdzeni, pamięć cache,
czy częstotliwość taktowania. Niemniej większość osób może być jednak bardziej
zainteresowana, co potwierdzają niestety badania, nie tyle parametrami
technicznymi jednostki centralnej, ale jedynie ogólną charakterystyką sprawności
procesora, w czym ma pomóc wzorowany na wykorzystywanym w hotelarstwie system
gwiazdkowy. Signum temporis, ale mnie ten pomysł się jednak zupełnie nie podoba.
Na zakończenie dodam tylko, że inżynierowie z Intela już dziś intensywnie
pracują nad kolejną generacją, tym razem 22 nanometrowych układów. Mają one
pojawić się w 2011-2012 roku. Może już za pół roku będziemy zatem mogli napisać
cos więcej na temat układów o kodowych nazwach Ivy Bridge i Haswell.
Autor: Marcin Bieńkowski
Komentarze (33) |