ELO und DWZ – Zahlenwerte und Aussagekraft

ELO versus DWZ:

Die aufgeführten Elowerte sind immer relativ. Es spielen einfach stets unzählige Faktoren mit rein, gleichermaßen wie bei der DWZ (Deutsche Wertungszahl). Die Wertungszahl wird nur über eine andere Formeleinheit berechnet, die andere Parameter verwendet. Wodurch nur Annäherungen erreicht werden und im spekulativen Bereich verbleiben.

Die SSDF-Elo wurde im Jahr 2000 für die Bewertung von Schachcomputern und Schachsoftware pauschal um 100 Elo abgesenkt. Vermutlich um nicht zu letzt der Eloinflation entgegen zu wirken. Die enorme Leistungsfähigkeit der Workstations haben die Engines an Spielstärke rasant wachsen lassen und in hohem Tempo eine Differenz erzeugt im Verhältnis zu den Schachcomputern aus den frühen Zeiten. Turniere, die so in Direktvergleichen gespielt wurden, führten dadurch zunehmend zu verzerrten Ergebnissen. Vor allem dann, als die Unterschiede nicht mehr nur lediglich marginal zu bewerten waren. Der Sprung zu Multi-Core-CPU´s auf denen moderne Software zum Einsatz kam, war auf herkömmlichen Schachcomputern nicht mehr machbar.

Inwieweit die Absenkung um 100 Elo den Gegebenheiten Rechnung trägt sei dahingestellt. Ich würde eher individuell abwägen, je nach Gerät und Programm. Also inwiefern die Listenangaben der SSDF von 1992 oder jener von 2000 zutreffen. Was natürlich zuletzt auch davon abhängt wie gut man mit dem Schachcomputer oder der jeweiligen Software vertraut ist. Die Angabewerte ohne jeglichen Praxisabgleich vorzunehmen macht wenig Sinn, weil nur viele ausgespielte Partien einen Überblick verschaffen können. Ich halte das für plausibler, weil bei Spielen zwischen Mensch und Maschine, die Fehler Letzterer in bestimmten Stellungen wiederholt vorkommen können.

Einfach formuliert: ich spiele eine Partie wieder und wieder, gewinne irgendwann in diesem oder jenem Stellungstyp und denke, somit gegen den Computer an Spielstärke zugelegt zu haben. Und hierin liegt der grundlegende Irrtum. Denn in Turnierpartien gegen menschliche Gegnerschaft ist dieses Vorgehen in einem solchen Sinne nicht möglich. Da braucht es viele zeitversetzte Anläufe um eine nahezu identische Position in irgendeinem Eröffnungssystem zu einem späteren Zeitpunkt wieder auf das Brett zu bekommen, wenn überhaupt jemals.

Das verringert nicht die Spielfähigkeiten des Programms, weil es aufgrund seiner Suchbaumstrategien so oder so eingegrenzt agiert. Feste Konzepte kann es nicht entwickeln, denn die Software ist aus der Eröffnungstheorie heraus begrenzt. Wir suchen dagegen nach alternativen Wegen auch an Stellen wo es der Horizont eines alten Programms nicht zuließ. Was daran lag, dass eine direkte Lernfähigkeit selten gegeben war. In Ausnahmefällen wurde das in limitierter Form einprogrammiert. Ich spreche mehr von früher, da waren die elektronischen Speicherchips noch gering dimensioniert.

Allerdings muss gleichzeitig erwähnt werden, dass das Schachprogramm einen wesentlichen Vorteil dadurch erreicht, weil es keinem physischen Verschleiß unterliegt und sein Spiel unbeeindruckt fortsetzt. Und exakt diese einfache Komponente ist die Stärke der Maschine. Während zudem nicht wirklich triviale Fehler passieren, weil bis zu einem gewissen Level der Computer solche fast gänzlich ausschließen kann, ist die Gefahr bei menschlichen Spielern dagegen weitaus größer, nach einer Serie starker Züge einen Blackout zu produzieren, der die Partie verliert.

Viel schwieriger wird es noch die DWZ eines Schachcomputers zu ermitteln, denn die weicht von der schwedischen ELO in aller Regel ab, mal mehr, mal weniger. Das hat damit zu tun, dass die alten Brettgeräte seit ihrem Erscheinen nur in kleinerer Anzahl Partien gegen menschliche Gegner gespielt haben, womit zu wenig ausgewertete Turniere vorliegen. Diese Vergleiche wurden über einen Zeitraum von 10 Jahren in Spanien verstärkt durchgeführt. Auch damals von der schwedischen SSDF und einigen starken Spielern in Communities. Nicht zu vergessen, die Zeit um 1990 herum, als es den damals stärksten Entwicklungen gelang, gegen Bundesligaspieler top abzuschneiden.

Trotzdem bleibt es natürlich schwierig, irgendwelche Konstanten zu finden, die eine konkrete Einordnung ermöglichen. Um das zu erreichen müssten konventionelle Schachcomputer in Vereinsligen über Jahre mitspielen. Wird oder wurde aber nicht gemacht, wodurch eine große Bandbreite an Ergebnissen nicht vorhanden ist.

Was die Schachcomputer von einst, also vor allem die Entwicklungen bis Mitte, Ende der Neunziger angeht, so halte ich die neuen SSDF -Werte nach einiger Überlegung daher für etwas zutreffender, sonst würde sich der Kreis im Verhältnis zu den Programmen, die danach folgten nicht wirklich schließen. Es war nicht nur die neu entwickelte Software, die Maßstäbe setzte, das keineswegs allein. Aber Mehrkernprozessoren, 64-bit und Gigabyte an Speichergrößen im RAM wie im Programmbereich schafften einfach eine beträchtliche Ressourcenpower. Eine andere Liga, nur von der Hardware aus betrachtet. Jahrzehnte zuvor ist die Begrenzung der Speicherkapazität in EPROM und RAM-Bausteinen schlicht das eigentliche Problem gewesen.

Zurück zum Gedanken der Vergleichbarkeit von ELO vs DWZ:

Über der Marke von 2100 Elo ist mehr und mehr Angleichung vorhanden, weil Spieler dieser Klasse deutlich mehr Turniere spielen, die beide der o.g. Maßeinheiten berücksichtigen.

Als Faustregel gilt: aber nur begrenzt, weil diese nur relativ anwendbar ist – ELO – 520 * 1,25 = DWZ (stellt schlicht eine Richtwertformel dar)

Beispiel: Schachsoftware Genius 3 (2311 Elo (486/ 50-66Mhz) aus dem Jahr 1996.

In diesem Fall würde die Berechnung lauten: 2311 – 520 * 1,25 = 2238 DWZ

Spekulativ? Ja sicher. In der Praxis hängt es halt von vielen Faktoren ab.

Kennt ein Spieler die Software und deren Spielweise, so reduziert sich deren Wert in gewissem Sinne individuell. Umgekehrt ist es natürlich auch denkbar. Ein starker menschlicher Spieler, der nie gegen Computer Matches bestreitet, wird sich definitiv schwerer tun und ggf. den sogenannten Umkehreffekt auslösen. Nicht zuletzt wird alles auch eine Frage der individuellen Motivation bleiben.

Ein weiteres Beispiel: Mephisto Atlanta (2084 Elo/ SH7034 Risc-CPU) Jahr 1997.

Die Berechnung lautet auch hier: 2084 – 520 * 1,25 = 1955 DWZ

In den AEGON Turnieren vor über 20 Jahren (Man-Machine, Niederlande) ist das Ding wirklich cool im Rennen gelegen. Aus damaliger Sicht sogar unterbewertet. Die Gegner waren bis zu über 2300 Elo stark und der Computer (dato noch mit 2185 Elo bewertet) holte sich einen Score von 50%. Zu jener Zeit ein erstaunliches Ergebnis. Inzwischen sieht das etwas anders aus. Computer werden mit leistungsstarken Engines zur Analyse von Partien eingesetzt. Zudem hat sich die Theorie in einem erheblichen Maß weiterentwickelt.

Sogenannte Anti-Strategien, die sich bereits vor 30 Jahren entwickelten, machten es den Mikroschachcomputern um einiges schwerer. Zumeist waren es Anti-Theorie-Züge, die während der Eröffnung den Computer aus seiner Bibliothek reißen sollten oder Varianten, die dem Gerät noch unbekannt waren. Gleichermaßen auch ermittelte Schwachstellen, die gezielt genutzt werden konnten um das Programm auszutricksen.

Mit den jetzt aktuellen Topengines ist dieses Vorgehen auf jenem Niveau nahezu unmöglich. Tablebases beherrschen Endspiele in Verbindung mit großen Datenbanken bis zu 7 Steinen perfekt. Diese profitieren von riesigen Powerbooks, welche die bekannte Eröffnungstheorie in stetiger Aktualisierung gespeichert haben, auch durch den Online-Zugriff. Die Zeiten haben sich eben geändert. Arbeitet die Engine zusätzlich mit KI-Implementierungen, lernt diese selbst und agiert zusehends fehlerloser.

Noch ein Beispiel zuletzt: Mephisto Berlin (2015 Elo /Motorola 68000) von 1992.

Wendet man die Formel an, ergibt sich: 2015 – 520 * 1,25 = 1869 DWZ

Der Gedanke ist nur die Wahrscheinlichkeitsrechnung, der in dieser Formel verankert ist. Zum Teil kombiniert mit Erfahrungswerten, die diese Annäherung ergeben.

Der Mephisto Berlin 68000 spielt sehr solide von der Eröffnung bis hin zum Endspiel. Das macht ihn vom Stil menschlicher. Das Programm ist wissensbasiert und selektiver. Seine Anfälligkeiten liegen in taktischen Situationen, seine Stärken im positionellen Spiel. Ganz im Gegensatz zum Mephisto Atlanta, der taktische Verwicklungen bevorzugt und super aktives Schach spielt.

Für Vereinsspieler ist der Atlanta vermutlich das größere Problem. Denn taktisch ist er kaum zu überrollen und auch im Endspiel nicht unbedingt zu unterschätzen. Konkretes Wissen zu Bauernstrukturen ist vorhanden. Vor allem sind es aber seine Rechenfähigkeiten einschließlich der integrierten Hashtables, die ihm weitgehend solide Abwicklungen ermöglichen.

Eine Eichung auf feststehende Elo oder gar DWZ-Werte ist nicht möglich. Für eine grobe Einschätzung sollte die Abhandlung jedoch ein gewisser Richtwert sein.

In der Realität, wenn in vereinzelten Partien, Mensch und Schachcomputer aufeinandertreffen, entsteht überwiegend eine mehr oder minder kleine Abweichung. Je nach Spielertyp und Software-Algorithmus liegt diese bei locker +/- 50 DWZ . Wahrscheinlich teils sogar mehr.