|
||||
AW: Atlanta oder Magellan?
ich finde Deine Ausführungen sehr interessant. Könntest Du (wenn Du Zeit hast) ein oder zwei Beispiele von Stellungen bringen, bei denen der Atlanta und der Magellan unterschiedlich reagieren? Ich meine, dass Clones selbst im Spiel gegen gleiche Geräte, also Atlanta gegen Mystery bzw. Magellan gegen Mystery, unterschiedliche Ergebnisse bringen können, aber bei vorgegebenen Stellungen und gleichen Einstellungen der Clones sollten doch die gleichen Ergebnisse herauskommen, oder? Grüße Tom |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Tom,
ich bin zwar nicht Nick, aber ich kann auch ein bisschen was zu der Diskussion beitragen. Zitieren:
Ich meine, dass Clones selbst im Spiel gegen gleiche Geräte, also Atlanta gegen Mystery bzw. Magellan gegen Mystery, unterschiedliche Ergebnisse bringen können, aber bei vorgegebenen Stellungen und gleichen Einstellungen der Clones sollten doch die gleichen Ergebnisse herauskommen, oder?
Vielleicht gibt es ja auch identische Atlantas und Magellans, aber das ist schwer festzustellen. Wir wissen ja nicht, ob, und wenn ja, wieviele unterschiedliche Programmversionen im Umlauf sind. Man müsste mal Testergebnisse von allen Atlantas und Magellans, die hier im Forum "unterwegs" sind, sammeln; evtl. könnte man damit identische Versionen finden. Wenn das der Fall wäre, müssten wir nicht mehr nach Atlanta und Magellan unterscheiden, sondern nach Atlanta/Magellan "A", "B", "C" usw. Und dann kriegen wir wieder die altbekannte Diskussion, ob eine solche Diskussion sinnvoll ist oder nicht... viele Grüße, Robert |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Uwe,
dann will ich mich mal versuchen (aber Achtung, richtig wissenschaftlich wird das nicht, kann mich nur noch teilweise an die Statistik-Vorlesungen erinnern): Nimmt man an, daß sich die wahre Elo-Zahl eines Geräts nach Spielen einer unendlichen Anzahl von Partien ergibt, basieren die Zahlen in unserer Liste auf einer (je nach Gerät unterschiedlich großen) Stichprobe. Deshalb gehen wir davon aus, daß wir noch einen Meßfehler in der Zahl drin haben - repräsentiert durch die Standardabweichung (also die +/- Zahl). Die Standardabweichungen in der Liste haben eine Sicherheit von 90%, d.h. mit einer Wahrscheinlichkeit von 90% liegt die tatsächliche Elo-Zahl innerhalb dieser Grenzen. (Wollte man es sicherer, müßte man größere Abweichungen angeben.) Atlanta hat 2274 +/- 42, Magellan hat 2235 +/- 28 Mit anderen Worten können wir mit 90% Sicherheit sagen, daß sich die wahre Elo-Zahl des Atlanta zwischen 2232 und 2316 befindet, die des Magellan zwischen 2207 und 2263. Die beiden Bereiche überschneiden sich, d.h. es ist durchaus möglich, daß beide Geräte gleich stark sind. Allerdings überschneiden sie sich nur in den "äußeren Bereichen" der Verteilung. Du mußt Dir das wie zwei Gaußsche Glockenkurven vorstellen, die ihre Mitte bei 2235 und 2274 haben und sich in ihren flacheren Randbereichen überlappen. Man könnte die Wahrscheinlichkeit dafür garantiert ausrechnen - nur ich kann es nicht... Daher meine großzügige Schätzung im Ursprungsposting, zu der mein Bauch nach wie vor steht... Nur beweisen kann ich es nicht Vielleicht finde ich demnächst mal etwas Zeit, in meine alten Statistik-Skripte reinzuschauen. Dann rechne ich es mal vor, bin selbst auf das Ergebnis gespannt! Oder ist hier jemand anderes, der den Kram noch nicht vergessen hat? Viele Grüße, Dirk Geändert von Supergrobi (13.05.2009 um 13:19 Uhr) |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Willi,
Ich weiss du willst nur den Mystery 32MHz ganz oben an der Spitze sehen Ich kann es noch nicht beenden, ich hab ein paar sachen ua. ein anderes Turnier das ich zuerst noch beenden muss! Ist aber noch alles Geheim ich will noch nichts darueber verraten bis es in ein paar Wochen beendet ist Viele Gruesse Nick Du immer und Deine Geheimniskrämerei!!! Na, mach' mal - wird bestimmt wieder interessant... Gruß, Willi |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Nick,
Hallo Uwe,
Bei mir machten sie beide 6-7 abweichen pro spiel wenn ich meine das gleiche spiel zurueck spielen lasse. Das finde ich ein bischen zu viel. Dann bei Stellungstests gab es auch ein paar kleine abweichungen. Und zum schluss finde ich es noch schwer zu ertragen das der Magellan bei mir es auch geschafft hat gegen den Monte Carlo IV LE zu verlieren lol... was ja auch alles vielleicht zufall ist Ich hab mal ein Beispiel aus der CSS-Rangliste kopiert, nur um die Dimension mal sichtbar zu machen. 840 Partien in diesem Fall, das Gerät mit den meisten Partien unserer Aktivliste sind die GK2000 Clones mit 484 Partien, da wären also noch eine Menge Partien erforderlich. Code:
Thinker 4.7a 01.10.2004 [WB] Par- + = - Punk- Remis- Score Elo Elo + - 840 207 255 378 334,5 30,4% 39,8% 2656 2584 20 20 sollte man Partien, die im Autoplay Modus gespielt wurden, vergleichen. Ich habe hier mal eine Partie von Bernd aus dem Thread https://www.schachcomputer.info/foru...hlight=Atlanta genommen, ich konnte vor einiger Zeit eine Partie (mehr hab ich nicht getestet), einwandfrei mit meinem Magellan nachvollziehen. Allerdings spielt der Magellan diese Partie sehr!! schnell, 30 Sekunden pro Zug nimmt er sich auf keinen Fall, irgendwo so ab dem 15., 20. Zug geht das im 5 Sekunden Tempo weiter... komisch, aber die Partie ist zu 100% reproduzierbar. , so ähnlich wie hier, würde ich sagen. sollten in Partien auch keine größeren Abweichungen auftreten. ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter. Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir
Mit dem Mystery sind sicher noch viel zu wenig Partien gespielt worden, sein Rating ist sicher stark geprägt von seinem guten Abschneiden bei der Online-WM, aber das kann sich auch noch ändern. Viele Grüße Uwe |
|
||||||||||||
AW: Atlanta oder Magellan?
Da dürften die Meinungen aber heftig auseinandergehen. Ich will mir daher darüber erst garkeine Meinung bilden ausser: So viele Partien wie möglich! Zitieren:
2) Wie gross oder wie klein muesste die ELO differenz sein um zu sagen das 2 Geraete gleich sind?
Zitieren:
3) Wieviele abweichungen oder wie wenige muesste man haben in Ihren aktuellen Spielen? ... um zu behaupten das sie gleich sind oder nicht gleich sind.
Zitieren:
4) Reicht es wenn die Geraete den gleichen Chip haben, gleichen takt und gleichen buch? oder reicht es nicht?
Zitieren:
5) Was ist die toleranz bei stellungstest muss 100% oder weniger?
Zitieren:
6) Wie entscheidet man wenn zB der fall vorkommen wuerde wo die Stellungstest gleich sind aber die Spiel abweichungen bei unter 90% liegen?
Zitieren:
Ich glaube bei GM's oben an der spitze sind 42 ELO punkte ganz schoen viel.
Zitieren:
ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter.
Aus der Hauptgruppe rausfliegen bedeutet, gegen nominell schwächere Gegner antreten zu müssen als die in der A-Gruppe verbliebenen Geräte. Hier hat man dann Chancen auf mehr Punkte - Spielpunkte wie Elopunkte. Was an Elopunkten gewonnen oder verloren wird, unterliegt aber den gleichen Gesetzen (Formeln) wie auch in der A-Gruppe. Ich sehe hier keine Bevorteilung in irgendeiner Weise. Wenn es diese gäbe, müsste es logischerweise auch Benachteiligungen geben - worin sollen diese denn liegen? Zitieren:
Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir
Aber um noch mal kurz auf die Klone zurück zu kommen und hierbei auch auf das Thema "Verschiedene Programmversionen": Ich halte es für richtig, Geräte auf ihre "Gleichheit" zu prüfen und sie bei Übereinstimmung zusammenzufassen - so wird das Abbild der Spielstärke aussagekräftiger. Ich halte es ferner für richtig, Geräte mit Abweichungen zu trennen - wenn diese Abweichungen gravierender Natur sind. Ich halte es aber keinesfalls für richtig, Geräte wegen irgendwelcher Kleinigkeiten zu trennen. Man mag jetzt darüber diskutieren, was noch als Kleinigkeit angesehen wird und was nicht - man kann es aber auch lassen! Es gibt z.B. Abweichungen zwischen Milano V1.01 und V1.02, die sich bei einzelnen Spielzügen bemerkbar machen. Ich habe nie getestet, ob es auch andere Lösezeiten gibt, aber ich wette darauf, dass es so sein wird. Trotzdem reden wir immer nur von "dem" Milano, als wenn es nur diesen einen gäbe. Aber das ist auch gut so, denn am Ende kommt sowieso nur ein unwesentlicher Spielstärke Unterschied heraus - die Dinger tun sich nichts. Warum hier trennen? Solche Unterschiede gibt es ganz sicher auch zwischen GK2100-Mystery-RS2250XL, nur sind sie dort schon deutlicher (beim Mystery meine ich das Proggi, nicht die Taktung). Gleiches gilt bei Maggi und Atlanta. Vielleicht relativiert sich irgendwann wieder alles und selbst die beiden letztgenannten werden wieder zusammengelegt? So, genug davon... muss heute was früher weg zur Arbeit. Gruß, Willi |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Dirk,
Hallo Uwe,
dann will ich mich mal versuchen (aber Achtung, richtig wissenschaftlich wird das nicht, kann mich nur noch teilweise an die Statistik-Vorlesungen erinnern): Nimmt man an, daß sich die wahre Elo-Zahl eines Geräts nach Spielen einer unendlichen Anzahl von Partien ergibt, basieren die Zahlen in unserer Liste auf einer (je nach Gerät unterschiedlich großen) Stichprobe. Deshalb gehen wir davon aus, daß wir noch einen Meßfehler in der Zahl drin haben - repräsentiert durch die Standardabweichung (also die +/- Zahl). Die Standardabweichungen in der Liste haben eine Sicherheit von 90%, d.h. mit einer Wahrscheinlichkeit von 90% liegt die tatsächliche Elo-Zahl innerhalb dieser Grenzen. (Wollte man es sicherer, müßte man größere Abweichungen angeben.) Atlanta hat 2274 +/- 42, Magellan hat 2235 +/- 28 Mit anderen Worten können wir mit 90% Sicherheit sagen, daß sich die wahre Elo-Zahl des Atlanta zwischen 2232 und 2316 befindet, die des Magellan zwischen 2207 und 2263. Die beiden Bereiche überschneiden sich, d.h. es ist durchaus möglich, daß beide Geräte gleich stark sind. Allerdings überschneiden sie sich nur in den "äußeren Bereichen" der Verteilung. Du mußt Dir das wie zwei Gaußsche Glockenkurven vorstellen, die ihre Mitte bei 2235 und 2274 haben und sich in ihren flacheren Randbereichen überlappen. Man könnte die Wahrscheinlichkeit dafür garantiert ausrechnen - nur ich kann es nicht... Daher meine großzügige Schätzung im Ursprungsposting, zu der mein Bauch nach wie vor steht... Nur beweisen kann ich es nicht Vielleicht finde ich demnächst mal etwas Zeit, in meine alten Statistik-Skripte reinzuschauen. Dann rechne ich es mal vor, bin selbst auf das Ergebnis gespannt! Oder ist hier jemand anderes, der den Kram noch nicht vergessen hat? Viele Grüße, Dirk Viele Grüße Uwe |
|
||||||||||||
AW: Atlanta oder Magellan?
Es gibt z.B. Abweichungen zwischen Milano V1.01 und V1.02, die sich bei einzelnen Spielzügen bemerkbar machen. Ich habe nie getestet, ob es auch andere Lösezeiten gibt, aber ich wette darauf, dass es so sein wird. Trotzdem reden wir immer nur von "dem" Milano, als wenn es nur diesen einen gäbe. Aber das ist auch gut so, denn am Ende kommt sowieso nur ein unwesentlicher Spielstärke Unterschied heraus - die Dinger tun sich nichts. Warum hier trennen? Solche Unterschiede gibt es ganz sicher auch zwischen GK2100-Mystery-RS2250XL, nur sind sie dort schon deutlicher (beim Mystery meine ich das Proggi, nicht die Taktung). Gleiches gilt bei Maggi und Atlanta. Vielleicht relativiert sich irgendwann wieder alles und selbst die beiden letztgenannten werden wieder zusammengelegt
das ist auch mein Standpunkt. Ein Unterschied von +/-20 ELOs kann man tolerieren und die Kisten zusammenfassen. Ansonsten würde die Liste vollkommen unübersichtlich. Beispiel 1: Siehe oben - die Milano-Versionen. Gleiches gilt für Polgar, MM..Module oder diverse Lang WM Module. Geprüft hat hier noch keiner die Veränderungen der einzelnen Versionen, aber sie dürften gering ausfallen. Beispiel 2: Chessmachine, RISC 2500, Montreux! Wie bekannt sind die Dinger auch mit verschiedenen Bausteinen (Mhz/RAM) bestückt, also ergibt sich auch ein Unterschied in Lösungszeiten und/oder gespielten Zügen. Aber deswegen aufsplitten? Andererseits wird z.B. der Super Forte/Expert mit 5Mhz und 6Mhz getrennt gewertet. Falls diese sich auf "längere" Sicht, sprich mehr Partien, wieder annähern wäre ein gemeinsamer ELO-Wert mMn. auch hier sinnvoll. Schwierig wird es halt immer dann, wenn die technischen Angaben nicht sofort verifizierbar sind. Wer schraubt schon direkt einen Excellence (3,4 oder 5MHz) oder Constellation Expert (4 und 5MHz bekannt) auf bevor er seine Partien zur Auswertung freigibt. Stellungstests (BT-Test, Colditz) zum Vergleich sind mir da wesentlich lieber. Gruß, Peter |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Peter,
Gruß, Micha |
|
|
Ähnliche Themen | ||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Test: Wer ist der Endspielkönner: Lyon, London, Magellan oder Risc I? | bbbk | Teststellungen und Elo Listen / Test positions and Elo lists | 4 | 10.01.2009 14:30 |
Test: Klon Test Magellan - Atlanta | spacious_mind | Die ganze Welt der Schachcomputer / World of chess computers | 61 | 06.02.2008 23:31 |
Frage: Magellan Eröffnungsfehler oder ..? | OrinokoRM | Teststellungen und Elo Listen / Test positions and Elo lists | 4 | 08.12.2007 19:00 |
Frage: Star Diamond oder Atlanta | mclane | Die ganze Welt der Schachcomputer / World of chess computers | 25 | 21.09.2005 15:59 |