Großer 486er CPU Vergleich

  • In Ergänzung zu meinen Grafikkartentests für VLB und PCI sowie den Systemvergleichen von VLB und PCI kommt hier nun der 486er CPU Vergleich. Es gibt bereits sehr viele Vergleiche, insbesondere der von feipoa bei Vogons ist hier eine Referenz. Diesen fehlt es für meine Verständnisse und die Ableitungen, die ich ziehen möchte, zum einen an Nachvollziehbarkeit und zum anderen an Interpretierbarkeit, da zwischen den Tests die Boards wechseln oder der Local-Bus-Takt (PCI) ab 40 oder 50MHZ FSB halbiert wird.


    Als Basis nehme ich ein Board, das sowohl mit allen zu testenden CPUs klar kommt, als auch den Local-Bus synchron zum Frontside-Bus (FSB) steigert – dies geht beim 486er nur mit dem VLB. Die weiteren Komponenten (RAM, IDE-Controller, Festplatte) entsprechen denen der vorherigen Tests. Da ich diese Testreihe vor den anderen Reihen gestartet hatte, verwende ich hier noch eine andere Grafikkarte.



    Mit dieser Testreihe möchte ich folgende Fragen beantworten:


    • Welches die schnellste CPU mit Serientaktung für den 486er (ggf. nach den Cx5x86 120/133, die nicht an diesem Test teilnehmen)?
    • Was bringt größerer L1 Cache?
    • Ist der L1 Cache mit Write Back (WB) Strategie wirklich schneller als Write Through (WT)?
    • Intel vs. AMD vs. Cyrix?
    • Einfluss des FSB und ist der DX/50 wirklich schneller als der DX2/66?



    Der Testaufbau:



    • Mainboard: QDI V4P895P3 V3.0, 512kB Cache 12ns
    • Festplatte: Western Digital WD Caviar 21000 1GB
    • IDE Controller: Winbond ISA Multi-I/O Controller
    • RAM: 32MB FPM 60ns
    • Grafikkarte: Diamond Stealth 64 Video VRAM VLB (S3 968)



    Auf der SW-Seite kommt MS-DOS 6.22 als Unterbau zum Einsatz. Gebootet wird dabei bis auf den Logitech Maus-Treiber ohne TSRs sowie ohne Smartdrive mit XMS Speicher (HIMEM.SYS) sowie ohne geladene EMM386.EXE. Vor dem Start der Benchmarksuite von PhilsComputerLab wird der S3VBE20 geladen, sodass die SVGA-Tests mit LFB Unterstützung laufen. Nach den DOS-Tests wird das System im selben Modus neu gebootet und Windows 3.11 gestartet (32bit Dateizugriff aktiviert). Zur Vergleichbarkeit der Tests aus dem PC-Magazine werden alle Windows Tests mit dem Winstone95 in der Auflösung 800x600 mit 256 Farben durchgeführt.


    Bei den DOS-Benchmarks wähle ich Benchmarks mit applikativem Inhalt und vermeide (aus meiner Sicht wenig aussagekräftige) synthetische Benchmarks wie Speedsys und Norton. Für die Windows Benchmarks kommt der Winstone95 zur Anwendung - eine wirklich gelungene Benchmark-Suite, die sehr anwendungsnah die Systemperformance (HDD, RAM, CPU, Graka) wiederspiegelt. Die Unterschiede der Windows-Benchmarks sind demnach eine Mischung aus allen Komponenten. Das bedeutet, wenn allein die CPU einen Vorsprung herausarbeitet, dieser hier umso härter verdient ist. In Zahlen bedeutet das, der um 33% höher getaktete Am486DX5 133 schafft im Vergleich zur selben CPU mit 100MHz (ebenfalls 33MHz FSB) nur einen ca. 12% höheren Wert im Winstone95.



    Die Benchmarks:


    Für DOS aus Phils Benchmark-Set

    1. Superscape 1.0c - Taste 2
    2. Chris3D VGA - Taste 3 (benötigt FPU)
    3. Chris3D SVGA - Taste 4 (benötigt FPU)
    4. PCPlayer Bench VGA - Taste 5
    5. PCPlayer Bench SVGA - Taste 6
    6. Quake 1.06 - Taste c (benötigt FPU)
    7. Doom - Taste b (angepasst, Vollbild mit HUD)


    Für Windows kommt der Winstone95 zum Einsatz

    1. Business Graphics / Desktop Publishing - Aldus Pagemaker 5.0a / CorelDRAW 5.0 / MS PowerPoint 5.0
    2. Database - FileMaker Pro 2.12 / MS Access 2.0 / Paradox 4.5 / MS Works 3.0 (20%)
    3. Spreadsheet - Lotus 1-2-3 R4.01 / MS Excel 5.0 / Quattro Pro 5.0 / MS Works 3.0 (40%)
    4. Word Processing - Ami Pro 3.01 / MS Word 6.0a / WordPerfect 6.0a / MS Works 3.0 (40%)



    Die CPUs (im Test):



    • i486 SX/25 SX683 (iSX 25/33)
    • i486 DX/50 SX546 (iDX 33/50)
    • i486 DX2/66 SX955 (iDX2/66; WT/WB)
    • i486 DX4/100 SK096 (iDX4 75/100/120; WT/WB)
    • iPODP5V (iP24T 83/100; WT/WB)
    • Am486 DX4 120SV8B (DX2 66/80/100; DX4 100/120 8kB; WT/WB)
    • Am486 DX5 133V16BGC (DX4 100 16kB; Am5x86 133/150/160; WT/WB)
    • Cx486 DX40 (CxDX 40; WT)
    • Cx486 DX2-v80GP (CxDX2 66/80; WT)
    • Cx486 DX4-100GP (CxDX4 100; WT)
    • Cx5x86-100GP (Cx5x86 100; WT/WB) – Register: LSSER=OFF; MEM_BYP=ON; LOOP_EN=ON; DTE_EN=ON; FP_FAST=ON; CWB (nur WB)


    Der AMD 120SV8B mit 8kB L1 Cache unterstützt die Multiplikatoren 2x und 3x sowie L1 WT sowie L1 WB, womit hiermit ein großer Teil der AMD CPUs abgebildet werden kann. Beim Cyrix 5x86 habe ich sehr lange und ausführlich getestet, um alle Register, mit denen in diesem System ein stabiler Betrieb sowohl mit L1WT als auch WB möglich ist, zu ermitteln. Der Unterschied zum Setzen der beiden getesteten Modi WT/WB ist lediglich der zusätzliche Parameter CWB für Mode L1WB (Tool: 5x86.exe). Die Cyrix DX/DX2/DX4 können den L1 ebenfalls in WB treiben. Mit dem Tool ctchipz.exe kann ich die nötigen Register setzen und auch zurücklesen und bestätigen. Dies bleibt in diesem Board allerdings ohne jeglichen Effekt – der L1 verharrt laut CTCM im L1WT und die Performance ist identisch.



    Die Konfiguration:




    Das Board verfügt über 512kB L2 Cache (12ns) in WB mit dirty Bit. Dies Cache-Konfiguration ist nur Single-Banked, d.h. es ist kein entlastender Bank-Interleave möglich. Die stabilen Burst für den Cache ergeben sich mit diesem Board für die verschiedenen FSB Taktraten wie in der unten stehenden Tabelle. Die Maximale Geschwindigkeit für den L2 Cache ist nur bei 25MHz FSB möglich.


    Ich habe viele verschiedene 60ns FPM PS2 Module. Keines davon wollte bei meinen kühlen Kellertemperaturen mit dem 50MHz FSB in meinem Board einen 4-3-3-3 Burst stabil erlauben. Ich gehe davon aus, dass nur sehr gut selektierte 50ns Module dazu in der Lage sind – was allerdings bei sommerlichen Temperaturen wieder fraglich sein sollte. Der SIS 471 VLB Chipsatz schafft es, den Hauptspeicher schneller anzusteuern, allerdings möchte mein ASUS SV2GX4 nicht zuverlässig mit 50MHz FSB arbeiten. Der Opti 895 VLB Chipsatz ist nicht der allerschnellste, aber sehr stabil.


    Wie auch immer mit 50MHz FSB sind zusätzliche Waitstates auf dem Bus zum RAM und zum Cache nötig, was einen Teil des Geschwindigkeitsvorteils gegenüber 40MHz und 33MHz wieder zunichte macht. Immerhin, die Grafikkarte läuft verlässlich bei 50MHz ohne bremsende Waitstates. Die einzige ISA-Karte im System (bei 50MHz verbietet sich ein VLB Controller) wird in allen Testfällen mit ca. 10MHz am 16Bit Bus betrieben.





    Cache Read




    Cache Write




    RAM Read




    RAM Write




    AT Clock




    25MHz FSB




    2-1-1-1




    0 WS




    3-2-2-2




    0 WS




    FSB/3




    33MHz FSB




    2-2-2-2




    0 WS




    3-2-2-2




    0 WS




    FSB/3




    40MHz FSB




    2-2-2-2




    0 WS




    4-3-3-3




    0 WS




    FSB/4




    50MHz FSB




    3-2-2-2




    1 WS




    5-4-4-4




    1 WS




    FSB/5






    Testergebnisse:


    Zunächst erfolgt für eine faire Sortierung eine Normierung der DOS Einzeltests auf den i486DX/33. Das anschließende Diagramm zeigt die Einzelwerte der Tests. Die Tests des Winstone95 sind bereits normiert.






    Einige der späten und schnellen 486er kamen lange lach dem Pentium auf dem Markt. Zum Vergleich habe ich einen Pentium 75MHz, den langsamsten Vertreter seiner Art im Sockel5, in einem damals beliebten intel Plato Board mit Neptun Chipsatz mitlaufen lassen. Die Grafikkarte war ebenfalls eine Diamond Stealth 64 Video VRAM (S3 968), aber als PCI Variante. Ich muss zugeben, das P-Rating des Am5x86 sowie des Cx5x86 ist durchaus gerechtfertigt. Betreibt man den P75 in einem PB-gechachten Triton Board, sieht das natürlich anders aus ...


    Die Ergebnisse sprechen für sich, sind aber in der Fülle schwer zu erfassen, daher werde ich im Folgenden einige Auszüge zeigen und erläutern.

  • Die schnellste CPU mit 100Mhz


    Hier treten der intel DX4, die beiden AMDs mit 8kB sowie 16kB L1, sowie die beiden Cyrixe an, zum Vergleich nur in L1WT. Die CPUs reihen sich in den DOS Benchmarks wunderschön treppenförmig aneinander, wobei die Cyrix das Feld oben und unten flankieren. Am schnellste ist der Cx5x86 mit den stabil aktivierbaren Registern, dicht gefolgt vom iDX4. Der Abstand zwischen den beiden beträgt in DOS insgesamt etwa 1% und im Windows recht beachtliche 5%. Die Überraschung ist hier der AmDX4 mit 8kB Cache. Dieser Fällt im Winstone fast 10% hinter seinem gleich getakteten Bruder mit 16kB L1 Cache zurück. Diese und andere Ausreißer habe ich noch einmal verfiziert, die Messwerte sind reproduzierbar.

    Spannend auch, der mit 50Mhz FSB getaktete AMD DX2/100 mit 8kB L1 ist fast auf Augenhöhe mit dem iDX4.









    Das 66MHz Shootout ... und ein DX50



    Die 66MHz 486er waren für mich der Höhepunkt dieser Klasse, den iDX4 mal ausgenommen. Alle späteren 486er mit 80MHz oder über 100MHZ rannten schon dem Pentium hinterher und wurden, je später sie kamen, immer mehr zur Budget-Lösung. Aus der heutigen, nostalgischen Retro-Sicht ergeben sich andere Sichtweisen und Standpunkte - individuell. Dieser Vergleich lässt zwei spannende Aussagen zu.


    1. Der DX50 frisst immer noch den Staub des vergleichsweise langsamen Cyrix DX2/66. Die Legenden, dass ein DX50 schneller als ein DX2/66 ist, basieren vermutlich darauf, dass der DX50 in einem schnellen SIS oder Opti Board steckte und der DX2/66 in einem langsamen VIA (was gerne in den 93/94er Vobis VLB-Kisten steckte) oder ähnlichem.
    2. Der AMD ist etwa 1% langsamer als der intel, sowohl unter DOS als auch unter Windows






    Was bringt der größere L1-Cache in der Realität?


    Kurz und knapp, in DOS etwa 3% unter Windows etwa 10%. Mit L1WB ist der Effekt etwas stärker als mit L1WT. Die 10% in Windows sind wie oben beschrieben reproduzierbar, aber für mich irgendwie nicht plausibel. Vermutlich ist der deutlich jüngere 16kB BGC irgendwie optimiert worden im Vergleich zum 8kB SV8B.








    Um wieviel ist L1WB besser als L1WT?


    Ich muss sagen, diese Frage war einer der Hauptgründe, warum ich diesen Test hier gemacht habe. Es gibt hierzu so viele Behauptungen und Legenden, die sich mit meinen bisherigen Erfahrungen nicht decken, dass ich doch mal nachmessen musste. Zu bedenken möchte ich noch geben, dass das wichtigste Argument für L1WB damals der bis zu 30 prozentige Performancegewinn in L2 Cache-losen System war - Budget-Systeme. Aber wer baut sich als Retrofan so ein System auf? Wie auch immer diesen Nachweis bin ich nicht angetreten, meine Systeme haben aus Prinzip einen L2 Cache.


    Der durchschnittliche Performance-Gewinn durch L1WB beträgt bei den 486ern (mit einem L2WB) unter DOS als auch unter Windows exakt 2,2%. Einige Anwendungen wie Doom sowie CPUs wie der Am5x86 profitieren von WB etwas stärker andere CPUs wie der iDX2/66 (P24D) verlieren sogar fast 1% im Schnitt. Am meisten profitiert aber der Pentium (P24T) im 486er Schafspelz mit fast 10% unter Windows und über 5% unter DOS. Wer einen POD betreibt, sollte alles versuchen, den L1WB stabil zum laufen zu bekommen.










    Fazit

    • L1WB wird zumindest in Systemen mit L2WB etwas überschätzt und für den, der es braucht: je schneller die CPU, desto größer der Benefit
    • die Legende vom DX/50, der den DX2/66 zersägt, bleibt eine Legende solange es keine 8ns Cache Chips und 40ns FPM RAMs gab ... ähh gibt
    • Bei 100MHz nehmen sich die iDX4, der AmDX4 (16kB) und der Cx5x86 nicht viel, der Cyrix ist der schnellste
    • intel ist bei gleichem Takt immer etwas schneller als AMD
    • ich denke mit Serientaktung (also ohne Overclocking) wird der Cx5x86 133MHz am schnellsten sein
    • mit Overclocking ist der P24T alias Pentium Overdrive @100MHz der King im Sockel 3, dicht gefolgt vom AMD @150/160MHz




    Schlusswort


    Ich hatte mit vielen Ergebnissen gerechnet, aber so schwarz auf weiß hat dies schon eine andere Substanz. Auch hoffe ich, dass ich mit einigen Halbwahrheiten aufräumen konnte.

    Vielleicht hilft dieser Test in Ergänzung zu den Grafikkarten und Local-Bus Tests dem ein oder anderen bei der Systemzusammenstellung.

  • wahnsinn - ein Topbeitrag


    Ich hätte gerne noch den Cyrix GP100 als Vergleich gehabt :) - zwar kein klassischer 486er, aber den kann man auch gut "tunen"


    Vielen Dank für dieses megaausführlichen Vergleich

  • Hoom, ich denk, er meint Cyrix 5x86, schon weil er von "tunen" redet.

    Das Unterschiede zwischen AMD und Intel bei DX2-66 hatte ich 0 Unterschiede festgestellt. Zumindenst ist Standpunkt vor paar Monat her und ich habe nicht weitergemacht, nach Motto: Es ist eh 100% Kopie.


    Deutlichere Unterschiede zwischen Intel und Cyrix bei DX2-66 (und diverse Marke wie TI; ST, IBM bluelightning ist Cyrix-Design) ist festzustellen.

    FPU von Cyrix 486 ist messbar schlechter, dafür meldet Cyrix in Speedsys höhere Werte. Das ist auch Grund, dass ich Speedsys-Werte nicht besonders hohe Beachtung schenke, es ist synthetisch und nicht realitätsnah. Ich dachte, ich habe Werte falsch notiert und habe es wiedergeholt -> alles stimmt. Es stimmt in "etwa" mit deine Benchergebnisse drüber.

    CPU HerstellerCPU TypMoBo TypGrafikkarteChipsatzPCPBench 320PCPBench 640DOOM LODOOM HIFPSQuake 320Speedsys CPUSuperscape 3D BenchRating (beta)
    Intel 486DX2 66 @ 80MhzPAT48AV 1.40Eigenbau, 968VLS3 Vision 968, 0WS145,7722216134,569,630,558,8153,16
    Cyrix486DX2 80MhzPAT48AV 1.40Eigenbau, 968VLS3 Vision 968, 0WS14,25,4812264228,277,632,2354,7142,40



    Auch du hast festgestellt, dass Intel DX4 beste reine 486er , wenn es um Takt/Leistung anging.
    AMD DX4 mit 16kb L2 Cache habe ich nicht, ich nahm in dieser Fall AMD 5x86 mit 3x Multi. Das hast du auch nichts anders gemacht, weil AMD DX4 mit 16kB L1 Cache umgelabelte 5x86 ist.

    AMD DX4 16kb L1 hinkt messbar hinten Intel DX4 mit gleiche Takt und profitiert besser von Writeback-Cache (bis zu 13% Gewinn nach meine Tabelle). Intel DX4 Leistung wächst kaum mit Writeback (bis zu ~2% Mehrleistung). Derselbe mit AMD DX4 8kB L1: kaum Zuwachs. Da ist deine Vermutung mit Optimerung in Kern nicht so falsch.


    Deiner Exemplare ist SK096, der kann keine 2x Multiplikation. Ich würde gerne wissen, welchere Performance wird der i DX4 mit 50 Mhz FSB zeigen. Meine DX4 CPU ist "leider" auch SK096 neben alte SX900. Es gibt Intel DX4, der Multi 2x kann.


    Fakt, dass ich ziemlich von meiner 5x86 von Cyrix enttäuscht bin und habe nicht weitergemacht. (Ich schreibe extra "meiner" fett, damit paar Leute nicht paar aufm Schlips getretet fühlt )


    Somit haut meine Benchergebnisse in grosse Teil mit deine Ergebnisse.

    Dass S3 Vision968 VLB 50Mhz FSB mit 0 Waitstate packt, wunderte mich nicht mehr. Meine Eigenentwurf packt auch 50Mhz 0WS.


    Ich pflege meine Benchergebnisse mittweile in eigene Tabelle.


    3 Mal editiert, zuletzt von matt ()

  • @matt

    Ja, die Cyrix waren in den synthetischen Benchmarks meist besser. Allerdings kommt davon in der komplexen Realität nichts an. Für mich hat es eher den Anschein, dass Cyrix ihre CPUs auf die Routinen dieser Benchmarks optimiert hat. Daher habe ich diese Benchmarks nicht in die Wertung einbezogen. Am aussagekräftigsten finde ich tatsächlich den Winstone95. Dessen Testergebnisse im CPU-Ranking decken sich ganz gut mit meiner DOS Benchmarkauswahl.


    Allerdings muss ich auch sagen, dass die Cyrix zwar schlechter abschneiden, aber deswegen nicht schlecht sind. Es sind interessante CPUs mit eigenem Design (im Gegensatz zu AMD). Und wenn man den Cx5x86 zu den 486ern zählt ist er der schnellste bei 100MHz. Anstrengend waren tatsächlich die Stabilitätstests mit den verschiedenen Cx5x86 Registern. Für den Einen ist es Arbeit, für den Anderen ist es Spielraum zum tunen. Ich empfand es eher wie Arbeit.

    Die Cyrix DX und DX2 führten bei mir übrigens zu seltenen, sporadischen Abstürzen im Winstone, insbesondere bei Borland Paradox - so ganz 100% kompatibel sind die wohl nicht.


    Wie welche CPU vom L1 WB profitiert, habe ich ganz gut aufgeschlüsselt, aber 13% hat keine erreicht. Wie beschrieben, im Schnitt waren es 2,2% (der POD ist dort nicht mit eingerechnet).

    Der Performancegewinn hängt hauptsächlich von der Infrastruktur auf dem Board ab. Wie den Timings zum L2 Cache und RAM sowie der L2 Cachestrategie. Je ineffizienter der RAM und der L2 Cache arbeiten (z.B. langsame Bursts) und je schneller der L1 Cache ist (beim Pentium Overdrive durch die bessere Architektur, beim 486er durch den hohen Takt), desto höher ist der Effekt des L1WB.

  • richtig - die CPU ist ja dabei - war ich heute früh wohl noch etwas müde :)


    Du hast ja selbst deine Settings mit angegeben - sehr schön.


    Ich habe neulich meine Cyrix CPU nämlich auch mal "getuned" und war überrascht was für einen Leistungszuwachs das gegeben hat (wenn auch nur in den synthetischen Benchmarks)

  • Sind auch die DLC CPUs gelistet? Hab mir ein für das 386er Board gekauft samt passender Fpu und mich würde der Unterschied zum AM386 DX-40 interessieren 🙏

    1. K6-2+ 400, 128 SDRAM, Elsa Erazor II, USB Onboard, 80GB HDD, SB AWE64 (WIN98se)

    2. P1 133, 64MB PS/2, Matrox 4MB + Voodoo 4MB, CD-Wechsler 4x

    3. Tandon 286, 8Mhz, 1Mb Ram+3MB XMS, TVGA9000a 512Kb, SB CT2940->IDE Quadspeed-CD, Realtek 8019AS, XTIDE+1GB CF (DOS 6.22 2x2GB)

    4. M326 486DLC + 4c87DLC, 8MB SIMM, TVGA8900c 1Mb, SBPro2, 8x CD, Compex RL2000a PNP+XTIDE Rom, GW2760ex 16GB CF (DOS 7.1)

    5. I7 6700K @4.5Ghz, 16GB DDR4, GTX1080, 250GB SSD + 512GB NVME

  • Naja der Cyrix führt bestimmte Instruktionen/Schleifen einfach schneller aus, bezweifel das das eine Optimierung auf Benchmarks sein soll.

    Der NEC V20 macht z.B. ähnliches weshalb es damals auch NEC V20 Patches für manche Games gebraucht hat.

    Für viele Titel gab es auch Cyrix Patches, weil deren CPU Detection nicht damit zurecht kam.

    Immerhin muss man Cyrix für Eigenleistung loben.

    Der UMC Super ist soweit ich weiß auch so ein CPU der nicht direkt ein Intel Design ist.


    Die anderen sind nämlich größtenteils Intels Arbeit und mehr oder weniger nur angepasst. (AMD ist erst ab K5 wirklich deren Design.)

    совок

  • Leider nicht, die passen nicht aufs Board. Für einen DLC müsste ich auf die 386 Plattform wechseln und damit neben dem Board auch die Grafikkarte wechseln, was noch mehr Varianz reinbringt und die Vergleichbarkeit verringert. Den 386/DLC kann ich z.B. nur mit ISA Grafik testen.

    Dann habe ich meine Anfrage in den falschen Thread gesetzt. Wurde denn dazu überhaupt schon mal ein Vergleich gemacht ?

    1. K6-2+ 400, 128 SDRAM, Elsa Erazor II, USB Onboard, 80GB HDD, SB AWE64 (WIN98se)

    2. P1 133, 64MB PS/2, Matrox 4MB + Voodoo 4MB, CD-Wechsler 4x

    3. Tandon 286, 8Mhz, 1Mb Ram+3MB XMS, TVGA9000a 512Kb, SB CT2940->IDE Quadspeed-CD, Realtek 8019AS, XTIDE+1GB CF (DOS 6.22 2x2GB)

    4. M326 486DLC + 4c87DLC, 8MB SIMM, TVGA8900c 1Mb, SBPro2, 8x CD, Compex RL2000a PNP+XTIDE Rom, GW2760ex 16GB CF (DOS 7.1)

    5. I7 6700K @4.5Ghz, 16GB DDR4, GTX1080, 250GB SSD + 512GB NVME

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!