|
Sinds de introductie van de IBM-PC in 1981 worden we ermee
geconfronteerd: de bliksemsnelle veroudering van computers. Wie
er een koopt, is na twee jaar in het bezit van 'antieke' technologie.
Voornaamste oorzaak zijn de onstuitbare ontwikkelingen op het
gebied van de processor, het hart van uw computer. Maar blijft
dat ook zo? Een blik op het verleden, heden en de toekomst van
de processor.

Computers van vóór het transistortijdperk
waren enorme gedrochten. Uit die tijd stamt het begrip computerbug,
verzonnen door Grace Hopper. Ze was programmeur aan de Harvard-universiteit.
Op een avond in 1947 ontdekte ze een levenloos insect in één
van de (gloeiend hete) elektronische schakelingen van de Mark
II-computer. Hopper meldde plichtsgetrouw in het logboek dat Mark
II niet werkte vanwege een 'bug'. Deze term is een eigen leven
gaan leiden en heeft nu vooral betrekking op onverwachte foutmeldingen
in software.
De
basis voor de huidige processors werd in 1947 gelegd. In het Amerikaanse
Bell-laboratorium (tegenwoordig onderdeel van Lucent Technologies)
maakten John Bardeen en Walter Brattain een verbinding tussen
een stukje germaniumkristal en twee batterijen. De daaropvolgende
stroomstoot zorgde voor een versterking van het elektrische signaal
met een factor honderd. En dat terwijl er veel minder energie
nodig was dan bij radiobuizen, ook wel vacuümbuizen genoemd,
waarmee gangbare apparatuur destijds was uitgerust. De kristalschakeling,
die vanaf 1948 de naam 'transistor' meekreeg, werd vooralsnog
echter niet beschouwd als serieuze concurrent van de radiobuis.
Stroomversnelling
Toepassing in computers zoals we nu kennen is pas mogelijk geworden
vanaf 1957. Jack Kilby kwam op het idee om de elektronische transistoren
op één stuk halfgeleidermateriaal te bouwen, in
plaats van de tot dan toe gebruikelijke ontwerpen, waarbij losstaande
componenten aan elkaar werden gesoldeerd. Robert Noyce (één
van de oprichters van Intel) bracht twee jaar later met succes
een elektronische schakeling met diverse transistoren op een klein
plakje silicium aan. Hiermee zag de geïntegreerde schakeling,
ofwel de 'chip', het levenslicht. Bovendien verbeterde hij het
aanbrengen van de verbindingsdraadjes tussen componenten op het
circuit. Vanaf dat moment raakten de ontwikkelingen in een stroomversnelling.
Steeds meer transistors werden geïntegreerd op één
chip. In 1963 waren het er twintig, in 1965 veertig, en zes jaar
later liefst 2300 stuks, op de Intel 4004.

De 4004 van Intel verscheen in 1971 en moet
worden beschouwd als de 'moeder aller processors'. Ze werd voornamelijk
gebruikt in rekenmachines. Met een kloksnelheid van 108 KHz kon
deze processor een geheugen van maximaal 640 bytes aanspreken.
Upgraden
of achterblijven
De wetenschapper Gordon Moore (inderdaad, ook afkomstig van Intel)
voorspelde 35 jaar geleden dat elke anderhalf tot twee jaar de
complexiteit en snelheid van chips zou verdubbelen. Tot op de
dag van vandaag blijkt deze wetmatigheid van kracht te zijn, hoewel
er regelmatig vraagtekens bij worden geplaatst:
"De
Wet van Moore begint aan geldigheid te verliezen. Wetenschappers
hebben gewaarschuwd dat de fysieke grens van chiptechnologie bijna
is bereikt. Maar eveneens wordt verondersteld dat de wet zichzelf
in stand houdt, daar chipfabrikanten aan de hand van die wetmatigheid
hun doelstellingen formuleren." (Planet Multimedia, juli
2000)
"De
Wet van Moore is een wet van niks. Hij is niet gebaseerd op fatsoenlijk
onderzoek. Er zit geen theorie achter. Hij verklaart niets, hij
beschrijft alleen. En hij voorspelt altijd hetzelfde: over anderhalf
jaar tweemaal zoveel. Je kunt er niets anders mee." (Intermediair,
maart 2001)
Er bestaan ook enkele knelpunten die weinig met transistors te
maken hebben. Zo is een systeem met een processor van 2 GHz in
de praktijk lang niet twee keer zo snel als een machine die draait
op 1 GHz. Dat heeft vooral te maken met de FSB (de bandbreedte
waarmee de processor met het geheugen communiceert). Achterblijvende
FSB-bussnelheden vormen een lelijke flessenhals voor de allersnellste
processors. Ook RAM-modules en chipsets op moederborden moeten
fors sneller worden, willen ze een 10 GHz-processor kunnen bijbenen.
Daarnaast zijn de prestaties van een processor afhankelijk van
twee kleine stukjes geheugen op de processor, het L1 en L2 cache.
Dit is een soort buffergeheugen waarin veelgebruikte instructies
worden opgeslagen zodat ze sneller kunnen worden uitgevoerd. Een
grotere cache zorgt voor een meer efficiënte afhandeling
van de processortaken. Met nieuwe fabricagetechnieken is het zelfs
mogelijk geworden om werkgeheugen op de processor aan te brengen,
het 'High Level 3 cache'. Intel heeft aangekondigd om de McKinley
met dergelijk geheugen uit te rusten.
Productietechnieken
Reguliere verhogingen van de kloksnelheid worden doorgaans bereikt
nadat een verbeterde productietechniek is doorgevoerd. Chipkernen
(cores) worden met honderden stuks tegelijk 'gebakken' op een
wafer, waarbij de transistoren op een plakje silicium worden aangebracht.
Sinds korte tijd worden de lijntjes op een processorkern geëtst
met behulp van het 0,13 micron (130 nanometer) proces. Dat was
0,18 micron bij de Pentium III en 0,25 micron bij de Pentium II-processors.
Gevolg is dat de chips in omvang afnemen, met gunstige gevolgen
voor het energiegebruik. Ander pluspunt is dat er meer ruimte
overblijft voor het uitdijende cachegeheugen. Naast de verkleining
van het productieproces zijn andere verbeteringen in aantocht.
SOI (Silicon on Insulator) is een nieuwe fabricagetechniek van
IBM, waarop door AMD een licentie is genomen. SOI poogt prestaties
te verbeteren door een laagje oxyde tussen de transistor en het
silicium aan te brengen. Het oxyde schermt de transistor af van
het silicium, zodat het energieverlies wordt beperkt. Dit levert
snellere transistors op, die bovendien minder stroom nodig hebben.
Toshiba claimt een mogelijke opvolger te hebben gevonden voor
SOI, in de gedaante van SON (Silicon on Nothing). Waar bij SOI
nog op delen van de wafer een isolator wordt aangebracht, is dit
bij SON overbodig door het gebruik van gaatjes in de wafer. We
kunnen deze techniek rond 2005 operationeel verwachten, geproduceerd
via een 0,05 micron proces, aldus Toshiba. Intel heeft aangegeven
twijfels te hebben over de effectiviteit van SOI op lange termijn.
De energievoordelen zullen volgens het bedrijf wegvallen naarmate
de productietechnieken kleiner worden. Intel zoekt de oplossing
in HyperThreading, een techniek die de processor wijsmaakt dat
hij met z'n tweeën is. Een thread (niet te verwarren met
een discussie-onderwerp in een forum) is een bepaald deel van
een programma dat onafhankelijk van andere delen van het programma
op de achtergrond kan worden uitgevoerd. Het resultaat is een
betere benutting van de execution units en dus een hogere doorvoersnelheid.
Deze functionaliteit was al aanwezig op de oudere Pentium 4 en
Xeon processors, alleen zijn de betreffende circuits hierop nog
niet ingeschakeld. Helaas bestaat er geen 'tweak' om dit te activeren.
32-bits software zal overigens niet sneller draaien door HyperThreading,
er moeten speciale programma's voor worden geschreven om de kracht
ten volle te benutten.

Op een 'wafer' worden tegelijkertijd honderden
processorkernen geproduceerd en getest.
CISC en RISC
Niet alleen het aantal transistors, maar ook de architectuur van
een processor is van invloed op de uiteindelijke prestaties. Het
belangrijkste onderscheid valt te maken tussen CISC (Complex Instruction
Set Computer) en RISC (Reduced Instruction Set Computer). CISC-processors,
zoals de complete x86 familie van Intel en AMD, zijn voorzien
van een kern die slechts enkele eenvoudige handelingen kan uitvoeren.
De 'domme' processor moet op een slimme manier worden aangestuurd.
Slimme programma's zijn echter moeilijk te programmeren en vragen
relatief veel geheugenruimte. Dit was lange tijd onaanvaardbaar,
vanwege de hoge prijzen van RAM-modules. Daarom werd een soort
tussentaal op de processor aangebracht, de zogenaamde microcode
(ook wel Instruction Set Architecture genoemd). De microcode van
de processor bevat instructies die de specifieke functies van
de processor aansturen.
Ruim tien jaar geleden werd RISC geïntroduceerd, een techniek
zonder microcode waarbij minder transistors nodig zijn. De Motorola-processors
in computers van Apple maken gebruik van deze techniek. Een voordeel
van het volledig 'hardwarematig' uitvoeren van instructies is
dat dit meestal slechts één enkele klokpuls vergt.
Wel gaat de snelheidswinst gedeeltelijk verloren doordat de processor
meer arbeid moet verrichten. In plaats van één enkele
instructie moet een programma meerdere instructies bevatten om
dezelfde taak te kunnen uitvoeren.
EPIC
Verschillen tussen CISC en RISC beginnen steeds meer te vervagen.
De huidige RISC-chips bevatten een instructieset die in complexiteit
niet onderdoet voor de CISC-processors. De PowerPC 601 ondersteunde
bijvoorbeeld meer instructies dan de Pentium. Toch wordt de PowerPC
een RISC- en de Pentium een CISC-chip genoemd. Sinds kort zijn
processors met een compleet nieuwe architectuur verkrijgbaar ('Explicitly
Parallel Instruction Computing'), een architectuur die de kruisbestuiving
tussen CISC en RISC definitief gestalte lijkt te geven. Zoals
het woord 'parallel' doet vermoeden kan EPIC relatief veel instructies
tegelijkertijd verwerken. EPIC probeert wachttijden te minimaliseren
door middel van speculatie. De processor wordt bij wijze van spreken
alvast gewaarschuwd dat bepaalde gegevens binnenkort nodig zijn.
Zo kan hij de gegevens alvast doorsturen naar het cachegeheugen.
EPIC is ondertussen verkrijgbaar in de vorm van de Itanium-processor.
Itanium
en Sledgehammer
Zes jaar geleden begonnen Intel en Hewlett Packard aan de ontwikkeling
van een 64-bits architectuur (IA-64). Het resultaat, de vorig
jaar geïntroduceerde Itanium, is een van de grond af opnieuw
ontworpen processor. Benchmarks laten fraaie resultaten zien,
in vergelijking met snelle jongens als de Alpha 21264 en de HP
N4000. Gemeten in MFLOPS is de Itanium, waarvan de opvolger 'McKinley'
overigens al weer voor de deur staat, ongeveer 50% sneller. Vooral
dankzij een volledig gepipelinede FPU, die vier floating point
operaties ('achter de komma berekeningen') per kloktik kan afhandelen.
Het benchmarken met MFLOPS is trouwens niet onomstreden. Floating-point
instructies worden namelijk door elke processor op een eigen manier
afgehandeld, hetgeen gekleurde testresultaten oplevert. Belangrijker
is de vraag hoe bestaande software presteert in samenwerking met
een bepaalde processor. Veel 32-bits programma's draaien als een
natte krant op de Itanium. Voor optimale snelheid zal oudere software
moeten worden herschreven, dat is de voornaamste reden waarom
IA-64 voorlopig niet op de consumentenmarkt zijn intrede zal doen.
Ook bij AMD is een 64-bits processor in ontwikkeling. De 'Hammer'
ziet halverwege 2002 het levenslicht en integreert opvallend genoeg
twee processorkernen op één chip, die samen een
gedeeld cachegeheugen van liefst 1 MB gaan gebruiken. Als zodanig
functioneert de chip in feite als multiprocessor-systeem. Net
als de Itanium is de Hammer in eerste instantie vooral op de servermarkt
gericht.

Met het programma Sandra van SiSoftware is het
mogelijk om uw systeem te benchmarken. Op
www.sisoftware.co.uk/sandra kunt u de gratis 'Standard' versie
downloaden. De processorsnelheid wordt gemeten in MIPS (miljoen
instructies per seconde) en MFLOPS (miljoen floating-point operaties
per seconde), waarbij helaas nauwelijks rekening wordt gehouden
met de architectuur en instructieset van een processor.

AMD en Intel steken elkaar beurtelings de loef
af met snelle processors. Voordeel voor Intel is op dit moment
de betere schaalbaarheid van de Pentium 4. Dit betekent dat de
architectuur extreem hoge kloksnelheden toelaat, volgens Intel
zelfs tot 10 GHz. Wel is een lager geklokte Athlon XP in veel
gevallen sneller dan de Pentium 4. Daarom heeft AMD een oude verkooptruc
van Cyrix uit de kast gehaald. Zo draait een Athlon XP 1800+ in
werkelijkheid op 1,53 GHz. De 'claim' van AMD lijkt meer gerechtvaardigd
dan die van Cyrix, wiens 686+ een droevige floating-point
unit bezat en flink tekort kwam bij 3D-spellen.
Race
tegen de klokfrequentie
In augustus 1999 gebeurde het onmogelijke. De belangrijkste fabrikant
van processors, Intel, werd van de troon geduwd als leverancier
van de snelste x86-processor. AMD's langverwachte Athlon had niet
alleen een hogere kloksnelheid dan de snelste Pentium III op dat
moment, maar bleek ook nog eens superieur op het gebied van floating-point
berekeningen, die vooral van belang zijn bij de prestaties in
3D-spellen. Niet lang daarna won AMD ook nog eens de GigaHerz
race. Intel heeft deze aanval ondertussen gepareerd met de Pentium
4, maar feit blijft dat de nieuwe Athlon XP-processors klok voor
klok sneller zijn dan de Pentium 4, die bij identieke kloksnelheden
zelfs tegen een Pentium III Coppermine het onderspit delft. Opnieuw
vecht Intel terug, nu door de lancering van de Pentium 4 met Northwood-core
op 2,2 GHz. Deze chip wordt gefabriceerd met een 0,13 micron techniek
en bezit 512 Kb L2 cachegeheugen. De eerste benchmarks van de
Northwood laten 5% tot 10% snelheidswinst zien ten opzichte van
de voorganger, de Willamette-core. Belangrijker is dat de schaalbaarheid
voorlopig weer is veiliggesteld: snellere versies van de Northwood
zullen weldra volgen. Tot hoever AMD de Athlon-lijn nog weet op
te krikken is onduidelijk. Het wachten is momenteel op de Thoroughbred,
de 0,13 micron opvolger van de Palomino-kern die op de huidige
Athlons is te vinden. Volgens de roadmap van AMD wordt de Thoroughbred
in het eerste of tweede kwartaal van 2002 geïntroduceerd.
De marketingmachine van beide bedrijven draait in ieder geval
op volle toeren, maar het gaat dan vooral over ontwikkelingen
op lange termijn:
"Intel
beweert een technische doorbraak bereikt te hebben bij de productie
van processors. De chipfabrikant acht het mogelijk om binnen vier
jaar meer dan 400 miljoen transistors in één chip
te verwerken. De nieuwe transistors hebben een afmeting van slechts
0,03 micron. Dat zijn ongeveer drie atomen naast elkaar."
(Webwereld, december 2001)
"AMD
heeft een doorbraak geboekt op het gebied van transistors. Het
bedrijf heeft 's werelds snelste CMOS transistor ontworpen. Deze
maakt gebruik van 15 nanometer (0,015 micron) technologie en is
in staat om 3,33 biljoen keer per seconde te wisselen van een
0 naar een 1." (Tweakers, december 2001)
Vooruitblik
In 2006 bereiken processors vermoedelijk de 10 GHz grens. Deze
zullen worden gefabriceerd met een 0,03 micron proces. Als vanzelfsprekend
(kleinere transistors hebben immers minder stroom nodig) gaat
dan ook het core-voltage omlaag, in de richting van 0,5 Volt.
Een 10 GHz processor zal naar schatting 400 miljoen transistoren
bevatten, bijna tien keer zoveel als de Pentium 4. Een omvangrijk
deel daarvan is bestemd voor het cachegeheugen van minimaal 16
MB. Voorlopig biedt silicium als halfgeleider dus nog voldoende
mogelijkheden om de kloksnelheden op te voeren. Op lange termijn
zullen nieuwe 'nanotechnieken', die de verbindingen nog verder
kunnen verkleinen, soelaas moeten bieden.
Huidige chipmachines gebruiken optische lithografie als verkleiningstechniek.
De patronen worden aangebracht op een plak silicium door een lichtbundel.
Optische lithografie is echter niet geschikt voor het produceren
van chips met nano-details omdat de golflengte van het gebruikte
ver-ultraviolet licht te groot is. Om nog dunnere lijntjes te
kunnen etsen moet de golflengte omlaag, naar het gebied van extreem-ultraviolet.
Zodoende zijn wetenschappers nu aan het experimenteren met 'Extreem
Ultraviolet Lithografie'. Probleem is wel dat de golflengte van
dit licht dusdanig klein is, dat het geabsorbeerd wordt door conventionele
lenzen. Een oplossing is om spiegels te gebruiken die het licht
reflecteren. Dit moet echter met een ijzingwekkende precisie gebeuren,
en daar ligt op dit moment de voornaamste uitdaging voor de wetenschappers.

Het Nederlandse bedrijf ASML levert futuristische
machines die chips kunnen produceren door middel van optische
lithografie. ASML lijdt behoorlijk onder de huidige crisis in
de halfgeleidersector en moest onlangs nog 1400 van de 8000 banen
schrappen.
Conclusie
Rekenen we door met de Wet van Moore, dan beschikt u ergens tussen
2015 en 2020 over een TeraHertz-processor. Of deze wet van kracht
zal blijven, hangt vooral af van de fabricagetechnieken. Op dit
moment geldt: wie de meeste transistors op een plakje silicum
aanbrengt heeft de snelste processor in handen. Maar de grenzen
van deze techniek komen vroeg of laat in zicht. Dunnere verbindingen
dan één atoom zijn sowieso onmogelijk. Technici
zullen, de fysieke beperkingen in ogenschouw nemend, met grensverleggende
oplossingen moeten komen. IBM is al bezig om een logisch circuit
te bouwen met koolstof nanobuizen in plaats van silicium. Hiermee
zal het mogelijk zijn om het aantal transistors met een factor
tienduizend te laten toenemen. En over enkele decennia bevatten
computers misschien geen elektronica meer, maar bijvoorbeeld enzymen.
In plaats van enen en nullen wordt de computer dan gevoed met
DNA. Het DNA molecule van de mens is ongeveer even groot als een
honderdste van de doorsnee van een haar, en heeft een opslagcapaciteit
van liefst 1,5 Gigabyte. Nu het praktische plafond van de transistordichtheid
langzaam in zicht komt, verschuift de focus van ontwikkelaars
dus naar andere zaken. Totdat er opnieuw een cruciale wetenschappelijke
doorbraak wordt geboekt, zoals in 1947. Dan kunnen alle prognoses
(eventueel samen met de Wet van Moore) de prullenbak in.
|