![]() |
AW: Wettkämpfe
Hallo!
Ich habe einige Computer der oberen Mittelklasse im Active Chess 30/60 getestet. GK 2100 - Zircon II 30 Min 4:6 60 Min 6:4 GK 2100 - Nigel 30 6,5:3,5 60 5,5:4,5 GK 2100 - Par Ex 16 MHz 30 3,5:6,5 60 2:8 Mit dem getunten Par Ex kommt der GK so gar nicht zurecht Zircon II - Par Ex 16 MHz 30 5:5 60 5,5:4,5 Zircon II - Nigel 30 6,5:3,5 60 4:6 Nigel - Par Ex 16 MHz 30 4,5:5,5 60 4,5:5,5 Modena 8 MHz - Zircon II 30 4:6 60 5,5:4,5 Modena 8 MHz - Nigel 30 3,5:6,5 60 3:7 Modena 8 MHz - Par Ex 16 MHz 30 2:8 60 4,5:5,5 Modena 8 MHz - GK 2100 30 5,5:4,5 60 2,5:7,5 Über 30 Min liegt damit der Fidelity vorne: 1.Par Ex 16 MHz 25,0 2.Zircon II........23,5 3.GK 2100.........18,5 4.Nigel.............18,0 5.Modena 8 MHz.15,0 Der GK lag sonst bei ähnlichen Vergleichen weit vorne, hier war es nicht zuletzt der Par der ihn zurückfallen läßt. Die Tabelle 60 Min: 1.Par Ex 16 MHz 23,5 2.Nigel.............22,0 3.GK 2100.........21,0 4.Zircon II.........18,0 5.Modena 8 MHz.15,5 Mit zunehmender Bedenkzeit legt der Nigel zu, der Novag baut eher ab. Tabelle 30 + 60 Min: 1.Par Ex 16 MHz 48,5 2.Zircon II........41,5 3.Nigel.............40,0 4.GK 2100.........39,5 5.Modena 8 MHz.30,5 Die ELO des Par schien mir bisher zu hoch, doch die letzte Liste bestätigte den Wert, wie es aussieht zu recht. Früher habe ich den Mach III in einem ähnlichem Feld mitspielen lassen. Seine Leistung war deutlich schlechter, insbesondere über die 30 Min. Gruß Eckehard |
AW: Wettkämpfe
Hallo Eckehard,
Zitieren:
Gruß Micha |
AW: Wettkämpfe
Ach so, dazu noch ein Nachtrag. Es ist, wie alles im Leben, eine Frage der Betrachtung bzw. Berechnung.
Ein Auszug aus einer Elo-Liste: Code:
74 Mephisto MM V 10 MHz + HG550 2071 68 67 77 55% 2033 27% Man beachte die Werte der Novag Super Expert Geräte... Gruß Micha |
AW: Wettkämpfe
Hallo Micha!
Bei der Liste fällt auf, daß die meisten Geräte deutlich weniger Punkte haben. Woher stammen die Werte? Gruß Eckehard |
AW: Wettkämpfe
Hallo Eckehard,
die oben angeführte Liste, zeigt Aktivschach-Elo-Zahlen. Aber ich habe noch eine Liste, diesmal aber Werte aus Turnierpartien. Diese finde ich noch spannender und sehr interessant. Auch hier wieder bitte den Blick auf die Novag Super Expert und V2 Werte richten und diese mit unserer momentanen Turnierliste vergleichen. Code:
Rank Name Elo + - games score oppo. draws Was fällt euch auf? Wie man sieht, die Nummer 1 der Liste ist auch hier der Tasc R40 V2.5 mit 2401 Elo, d.h. die Ausgangsbedingungen sind gleich. Erinnern euch die Novag Super Expert Werte nicht auch an die umstrittenen SSDF-Werte (alte Liste - also ohne die unsinnige 100 Punkte Abwertung) der damaligen Listen? Gruß Micha |
AW: Wettkämpfe
Ich hatte mir Deine obige Aktiv-Liste angeschaut, und dabei fest gestellt, dass Du offenbar ein anderes Berechnungs-, bzw. Bewertungssystem verwendet hast.
Die relativ niedrigere Bewertung des Novag-C halte ich für richtig, d.h., die 6MHz - Version liegt noch einen Tick niedriger, dafür die 5MHz-Version etwas höher. Womit sich der MMV / 10MHz die 2071 - Punkte verdient, weiß ich nicht so genau. Aber das liegt am grundsätzlichen Problem der ganzen Computer-Computer-Partien. Meiner Ansicht nach wirken sich vergleichsweise geringe Leistungsunterschiede viel zu stark aus. Was das obere Ende angeht, hätten die Schweden aus meiner Sicht gerne noch mehr als die 100 Punkte abziehen dürfen. Aber die untere Mittelklasse wäre dann auf jeden Fall unterbewertet. Was also aus meiner Sicht notwendig wäre, wäre eine Art "Stauchungsfaktor", also ein Multiplikator "<1", für die Bandbreite der Liste. Beispiel: Also angenommen wir haben eine Bandbreite von 1400 Punkten (1000 Punkte bis 2400 Punkte), dann sollte die Untergrenze (1000) fix sein, aber der Rest im Bereich 1000 - 2400 auf die Obergrenze von 2200 durch einen Multiplikator normiert werden. Vielleicht wäre es auch eine gute Möglichkeit, wenn man Ergebnisse, die eine Überlegenheit von 80 Prozent (oder höher) anzeigen, gar nicht in die Berechnung eingehen lassen würde. Zur Turnierliste will ich angesichts der geringen Partien-Anzahl nicht viel sagen. Nur so viel: Der Super Forte A (1889) hat bei mir vor vielen Jahren gegen den Fidelity Sensory 12 (ca. 1700 Elo) 4:4 gespielt. Ich selbst habe im Jahr 1992 gelegentlich Langzeit-Partien (120min/Zug oder 60min/Zug) ohne jegliche Hilfsmittel gespielt - und dabei nicht verloren, obwohl ich nur Nicht-Vereins-Laien-Spieler bin. Der SFA ist auf längerer Bedenkzeit nicht viel stärker, weil er zu stark Brute-Force orientiert ist. Ein Mephisto MM IV beispielsweise, der ja nur knapp vor SFA liegt, profitiert da schon mehr von einer längeren Bedenkzeit. Und ist schon im Schnellschach dem Novag ein Stück voraus. Gruß Wolfgang |
AW: Wettkämpfe
Das ist ja interessant! Auch die Schröder-Geräte zeigen größere Unterschiede, und insgesamt scheinen die Werte rein optisch eher in Richtung SSDF zu gehen, zumindest bei den Geräten, die mir so ins Auge gefallen sind. Und das ist auf Basis der gleichen Partien nur mit einem anderen Algorithmus gerechnet worden? Ich hätte nicht gedacht, daß so große Unterschiede auf der gleichen Partienbasis möglich sind.
Viele Grüße, Dirk |
AW: Wettkämpfe
Hallo Dirk,
Zitieren:
Das interessante an diesen Test-Listen ist der Vergleich zu den SSDF-Listen. Ich hatte mich immer gefragt, wie die Listen der SSDF erstellt worden sind bzw. werden. In einigen Modul-Heften ging man auf das verwendete Programm etwas ein. Nicht sonderlich tief, aber immerhin. Wenn ich es richtig in Erinnerung habe, wurden keine Partien ausgewertet wie bei uns, somit erfolgte auch kein Dubletten Check (sehr fraglich für mich, aufgrund der Beschränktheit der Eröffnungsbibliothek einiger Geräte), sondern es war die Eingabe von reinen Ergebnissen erforderlich. Das Programm konnte man sogar käuflich erwerben. Naja, wie dem auch sei, wirft man nun einen Blick auf die Zahlen und zieht 100 Punkte (oder addiert diese bei der SSDF wieder auf) ab, so erinnern die Werte bzw. Abstände doch sehr stark an die der SSDF. Besonders interessant, die Werte der Novag Super Expert Geräte, die ebenfalls, wie bei der SSDF deutlich niedriger (im Vergleich) liegen als bei unseren Listen (Auswertung per EloStat). Womit auch die Theorie eines Ufo-Forschers widerlegt wäre, dass die Novag Ergebnisse in unseren Listen allesamt geschönt wären... ;) Im angesprochenen PC-Bereich ist die Auswertung natürlich aufgrund der Vielzahl an Partien sehr einfach. Die Auswerteunterschiede zwischen beiden Programmen sind gering, bei unseren wenigen Partien sieht die Sache völlig anders aus. Nun könnte man trefflich darüber streiten, welche Werte sinnvoller erscheinen. Macht aber wenig Sinn, denke ich, da zumeist der subjektive Eindruck entscheidet. Gut, letztendlich fand ich einfach nur die Zahlenspielchen interessant, die sich bei gleicher Datenbasis ergeben haben. Gruß Micha |
AW: Wettkämpfe
Hallo Micha,
interessanter Ansatz. Lässt sich kurz (für Laien erläutern worin der Unterschied in der Berechnungsformel liegt? Gruß, Peter |
AW: Wettkämpfe
Zitieren:
Beispiel: Programme A und B spielen 10 Partien. 1:0 1:0 0:1 1:0 0:1 0:1 1:0 1:0 1:0 0:1 (Es sind nur 10 Partien, die Statistik ist also mit einem sehr großen Fehler behaftet - aber das ignoriere ich jetzt mal) Das Match ist also 6:4 ausgegangen, d.h. bei einer Wiederholung sind wieder 60% für Programm A zu erwarten. Wenn jetzt die Partien 5 und 6 identisch verlaufen sind, was sagt uns das? Sind die Programme dadurch unterschiedlich in ihrer relativen Stärke? Nein, denn die Erwartung ist immer noch 60% für A. Bei einer Filterung der Dubletten wäre das Ergebnis 6:3 und ein Leser würde 66,7% für A erwarten. |
Alle Zeitangaben in WEZ +2. Es ist jetzt 07:51 Uhr. |
Powered by vBulletin (Deutsch)
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
©Schachcomputer.info