|
||||||||||||
AW: Neue ELO-Liste
Hallo Rainer,
![]() Hi Steffen
Ich habe mal fünf Partien gegen den Mephisto MM V gespielt, der Star Ruby hat mit 3:2 gewonnen. Ich glaube, dass er auf der Höhe der besten 8 bitter steht. Vielleicht sollte man mal einige BT2450-Aufgaben eingeben, um zu sehen, ob meine Vermutung stimmt... Die Ergebnisse sind sehr schwankend: gegen den Miami hat der Emerald mit 8:2 gewonnen, während er gegen den MM IV mit 2,5:5,5 zurückliegt. Und gegen den Cosmos (GK2100) steht es 2:2. Miami und MM IV sind in der SSDF-Liste ja fast gleich bewertet. Ich wiederhole auch den WK gegen den SuFo C, da letzterer damals evtl. eine Macke hatte und unter seinen Möglichkeiten gespielt hat (2:8 gegen den Emerald war schon recht happig) Derzeit müßte es etwa 4,5:3,5 für den SuFo C stehen, was mir schon realistischer vorkommt. Ich hätte den Emerald auf ca. 1950 geschätzt. Wenn es sich also beim Star Ruby um das gleiche Programm mit geringerer Speed handelt, sollte er etwas darunter liegen. Aber er kann mit den besten 8-Bittern ganz gut mithalten! Zitieren:
Das gute Stück hat aber auch so seine Mängel: Display lässt sich nicht beleuchen, kein Netzanschluss, Batterien halten nur ca. 30- 50 Stunden.....
Batteriebetrieb und Displaybeleuchtung schließt sich wohl gegenseitig aus! viele Grüße, Robert |
|
||||||||||||
AW: Neue ELO-Liste
Hi zusammen,
![]() Ich vermute auch, dass die V 11 von Gerät zu Gerät unterschiedlich stark spielt. Eine Differenz von +/- 50 ELO halte ich für wahrscheinlich.
Viele Grüße, Martin |
|
||||||||||||
AW: Neue ELO-Liste
Hallo Bernd,
![]() Hallo,
Ich vermute auch, dass die V 11 von Gerät zu Gerät unterschiedlich stark spielt. Eine Differenz von +/- 50 ELO halte ich für wahrscheinlich. Björn hat mich schon mal gefragt, ob ich einige seiner V11-Partien nachspielen könnte. Leider konnte ich aus Zeitmangel bislang nur eine seiner Turnierpartien nachspielen. Es gab tatsächlich 4 oder 5 Abweichungen, aber laut Fritz 7 bewegten sich die Unterschiede zwischen den gewählten Zügen im Bereich von wenigen Hundertstel! (es überraschte mich selbst, wie gering die Abweichungen waren!) Das könnte man durchaus dem Zufallsgenerator zuschreiben. Abschalten kann man ihn ja nicht (zumindest habe ich im Handbuch nichts gefunden) Oder sollte die V11 keinen besitzen? Denkbar wären natürlich auch Abweichungen in den Reaktionszeiten des menschlichen "Turnierleiters", die sich aufs Permanent Brain auswirken könnten. Ich habe den gleichen Gegner genommen, wie Björn in seiner Originalpartie (in diesem Fall den Risc 2500), um die Abweichungen so gering wie möglich zu halten. Aber ganz auszuschließen sind sie bei so langen Partien natürlich nicht! Übrigens: Meine BT-Ergebnisse für die V11 entsprechen den Angaben in der Liste; allerdings habe ich noch nicht alle Aufgaben getestet. Aber rein von der Geschwindigkeit her, kann man damit schon definitive Aussagen treffen. Und die Version müßte auch immer die gleiche zu sein (F40C - 38B9; siehe http://www.schachcomputer.at/tuning.htm) Woher sollten unterschiedliche Versionen heutzutage auch kommen? Zitieren:
Ich bin sehr gespannt auf die Aktiv-Schach-ELO Liste.
![]() Ich vermute mal, daß die V11 da bei weitem nicht so weit vorn sein dürfte wie auf Turnierstufe... viele Grüße, Robert |
|
||||||||||||
AW: Neue ELO-Liste
![]() Hi zusammen,
Ich könnte mir auch vorstellen, dass das "Problem" einfach bloß statistischer Natur ist. Wir sind beide mittlerweile der Meinung, daß die V11 erst bei längeren Bedenkzeiten ihre volle Stärke zur Geltung bringen kann. So hat Björn desöfteren beobachtet, daß sie auch bei längerem Überlegen durchaus noch sehr spät den "besten" Zug wechselt, was bei Lang-Programmen wesentlich seltener vorkommt. Und natürlich kann auch die Statistik eine Rolle spielen! ![]() viele Grüße, Robert |
|
||||||||||||
AW: Neue ELO-Liste
![]() Leider konnte ich aus Zeitmangel bislang nur eine seiner Turnierpartien nachspielen. Es gab tatsächlich 4 oder 5 Abweichungen, aber laut Fritz 7 bewegten sich die Unterschiede zwischen den gewählten Zügen im Bereich von wenigen Hundertstel! (es überraschte mich selbst, wie gering die Abweichungen waren!)
![]() Ich habe den gleichen Gegner genommen, wie Björn in seiner Originalpartie (in diesem Fall den Risc 2500), um die Abweichungen so gering wie möglich zu halten. Aber ganz auszuschließen sind sie bei so langen Partien natürlich nicht!
Übrigens: Meine BT-Ergebnisse für die V11 entsprechen den Angaben in der Liste; allerdings habe ich noch nicht alle Aufgaben getestet. Aber rein von der Geschwindigkeit her, kann man damit schon definitive Aussagen treffen. Ungefähr 8 BT-Stellungen (mehr habe ich bisher nicht getestet) meiner V11 entsprechen in etwa (Abweichungen -wenn überhaupt- im Sekundenbereich) den Listenangaben. ![]() Ich vermute mal, daß die V11 da bei weitem nicht so weit vorn sein dürfte wie auf Turnierstufe... viele Grüße, Robert Grüße Björn Geändert von Björn (11.04.2005 um 15:40 Uhr) |
|
||||||||||||
AW: Neue ELO-Liste
![]() Interessant. Hast Du die Abweichungen notiert? Die wären natürlich für mich von Interesse.
Allerdings wollte ich noch eine oder zwei Partien spielen, um ein einigermaßen gesichertes Ergebnis zu haben, bevor ich dir die Partien schicke. Aber wenn du sie schon eher haben willst: kein Problem! Zitieren:
Ungefähr 8 BT-Stellungen (mehr habe ich bisher nicht getestet) meiner V11 entsprechen in etwa (Abweichungen -wenn überhaupt- im Sekundenbereich) den Listenangaben.
Zitieren:
Wohl kaum. Um ehrlich zu sein, bin ich über das mässige Abschneiden der V11 gegen den London68030 im Aktivschach etwas verblüfft... Aber mehr dazu später....
![]() bis dann, Robert |
|
|||||||||||
AW: Neue ELO-Liste
Hallo!
Ich finde die Unterschiede zwischen den V.11ern von Björn und Bernhard zu groß um sie durch Statistik zu erklären. Während Björns V.11 praktisch alles wegfegt, hat der von Bernhard schon mit schwächeren Geräten seine Probleme: Björns V.11_______________________Bernhards V.11 -Tasc R30 V.2,5 3,5:0,5____________3:9 -Atlanta_______8,5:1,5_____________4,5:1,5 -Risc 2500_____5:0________________3,5:2,5 -London 68030 19:9_______Berlin Pro 4:2 -Risc II_______14:6_______Sapphire 3,5:2,5 50 Punkte Unterschied scheinen mir etwas wenig, ich tendiere eher zu 100. Das zeigt auch Bernhards Turnier. Gruß Eckehard |
|
||||||||||||
![]() Hallo Eckehard,
ich habe ELOstat von Frank Schubert auf diese Ergebnisse losgelassen, um mal konkret zu schauen, wie es denn wirklich aussieht. Startwert war in beiden Fällen willkürlich 2400 (Naja, nicht ganz: Der Atlanta sollte als Eichgerät am Ende in beiden Fällen nahe der 2210 liegen). Für die +/- Werte und die Differenz zu den anderen Rechnern spielt das aber keine Rolle. Bei einer Basis von 67 (Björn) und 36 Partien (Bernhard) ergibt sich dann das folgende Bild: Björns V11: 2406-2598 Bernhards V11: 2292-2517 Jede der beiden Elospannen kann dabei natürlich noch (gleichermaßen!) mit einer Wahrscheinlichkeit von 1/20 falsch sein. Grüße, Martin P.S. Wenn ich noch eine Bemerkung machen darf... Statistisch gesehen ist es sinnvoll, ein Duell so lange durchzuführen, bis es zumindest nicht zu Null steht. Sonst entwertet man ein bisschen die eigene Arbeit... ![]() Björn: Code:
Program Elo + - Games Score Av.Op. Draws 1 V11 : 2499 99 93 67 74.6 % 2311 3.0 % 2 London 68030 : 2379 140 151 28 32.1 % 2509 0.0 % 3 Risc II : 2362 171 191 20 30.0 % 2509 0.0 % 4 Atlanta : 2208 290 299 10 15.0 % 2509 10.0 % 5 Tasc R30 : 2171 318 262 4 12.5 % 2509 25.0 % 6 Risc 2500 : 1909 0 0 5 0.0 % 2509 0.0 % Individual statistics: 1 V11 : 2499 67 (+ 49,= 2,- 16), 74.6 % Tasc R30 : 4 (+ 3,= 1,- 0), 87.5 % Atlanta : 10 (+ 8,= 1,- 1), 85.0 % Risc 2500 : 5 (+ 5,= 0,- 0), 100.0 % London 68030 : 28 (+ 19,= 0,- 9), 67.9 % Risc II : 20 (+ 14,= 0,- 6), 70.0 % Code:
Program Elo + - Games Score Av.Op. Draws 1 Tasc R30 : 2594 302 240 12 75.0 % 2403 0.0 % 2 V11 : 2404 113 112 36 51.4 % 2395 8.3 % 3 Risc 2500 : 2345 316 342 6 41.7 % 2403 16.7 % 4 Sapphire : 2345 316 342 6 41.7 % 2403 16.7 % 5 Berlin Pro : 2283 369 480 6 33.3 % 2403 0.0 % 6 Atlanta : 2213 334 409 6 25.0 % 2403 16.7 % Individual statistics: 2 V11 : 2404 36 (+ 17,= 3,- 16), 51.4 % Tasc R30 : 12 (+ 3,= 0,- 9), 25.0 % Atlanta : 6 (+ 4,= 1,- 1), 75.0 % Risc 2500 : 6 (+ 3,= 1,- 2), 58.3 % Berlin Pro : 6 (+ 4,= 0,- 2), 66.7 % Sapphire : 6 (+ 3,= 1,- 2), 58.3 % Geändert von Martin (12.04.2005 um 00:11 Uhr) |
|
|||||||||||
AW: Neue ELO-Liste
Hallo Martin!
Danke für die anschauliche Darstellung, scheinbar ist die Partienanzahl noch deutlich zu gering. Noch ein anderer Vorschlag zur ELO-Liste: Ich habe gesehen, der Risc 2500 hat gegen die V.11 mit der Einstellung "offensiv" gespielt. Das halte ich für einen starken Nachteil, zumal gegen den Über-Fidelity. Mich würde interessieren, wie der Risc 2500 mit den Einstellungen "aktiv" und "normal" spielt. Mein Risc zeigt damit bisher nur starke Leistungen. Gruß Eckehard |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Neue Turnier-Elo-Liste | Stefan | Teststellungen und Elo Listen / Test positions and Elo lists | 15 | 24.05.2007 11:49 |
Review: Neue Elo-Liste | Björn | Teststellungen und Elo Listen / Test positions and Elo lists | 2 | 10.11.2004 12:37 |
Neue Elo-Liste | Björn | Teststellungen und Elo Listen / Test positions and Elo lists | 0 | 27.07.2004 14:06 |