|
||||
AW: Atlanta oder Magellan?
ich finde Deine Ausführungen sehr interessant. Könntest Du (wenn Du Zeit hast) ein oder zwei Beispiele von Stellungen bringen, bei denen der Atlanta und der Magellan unterschiedlich reagieren? Ich meine, dass Clones selbst im Spiel gegen gleiche Geräte, also Atlanta gegen Mystery bzw. Magellan gegen Mystery, unterschiedliche Ergebnisse bringen können, aber bei vorgegebenen Stellungen und gleichen Einstellungen der Clones sollten doch die gleichen Ergebnisse herauskommen, oder? Grüße Tom |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Tom,
ich bin zwar nicht Nick, aber ich kann auch ein bisschen was zu der Diskussion beitragen. ![]() Zitieren:
Ich meine, dass Clones selbst im Spiel gegen gleiche Geräte, also Atlanta gegen Mystery bzw. Magellan gegen Mystery, unterschiedliche Ergebnisse bringen können, aber bei vorgegebenen Stellungen und gleichen Einstellungen der Clones sollten doch die gleichen Ergebnisse herauskommen, oder?
Vielleicht gibt es ja auch identische Atlantas und Magellans, aber das ist schwer festzustellen. Wir wissen ja nicht, ob, und wenn ja, wieviele unterschiedliche Programmversionen im Umlauf sind. Man müsste mal Testergebnisse von allen Atlantas und Magellans, die hier im Forum "unterwegs" sind, sammeln; evtl. könnte man damit identische Versionen finden. Wenn das der Fall wäre, müssten wir nicht mehr nach Atlanta und Magellan unterscheiden, sondern nach Atlanta/Magellan "A", "B", "C" usw. Und dann kriegen wir wieder die altbekannte Diskussion, ob eine solche Diskussion sinnvoll ist oder nicht... ![]() viele Grüße, Robert |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Uwe,
dann will ich mich mal versuchen (aber Achtung, richtig wissenschaftlich wird das nicht, kann mich nur noch teilweise an die Statistik-Vorlesungen erinnern): Nimmt man an, daß sich die wahre Elo-Zahl eines Geräts nach Spielen einer unendlichen Anzahl von Partien ergibt, basieren die Zahlen in unserer Liste auf einer (je nach Gerät unterschiedlich großen) Stichprobe. Deshalb gehen wir davon aus, daß wir noch einen Meßfehler in der Zahl drin haben - repräsentiert durch die Standardabweichung (also die +/- Zahl). Die Standardabweichungen in der Liste haben eine Sicherheit von 90%, d.h. mit einer Wahrscheinlichkeit von 90% liegt die tatsächliche Elo-Zahl innerhalb dieser Grenzen. (Wollte man es sicherer, müßte man größere Abweichungen angeben.) Atlanta hat 2274 +/- 42, Magellan hat 2235 +/- 28 Mit anderen Worten können wir mit 90% Sicherheit sagen, daß sich die wahre Elo-Zahl des Atlanta zwischen 2232 und 2316 befindet, die des Magellan zwischen 2207 und 2263. Die beiden Bereiche überschneiden sich, d.h. es ist durchaus möglich, daß beide Geräte gleich stark sind. Allerdings überschneiden sie sich nur in den "äußeren Bereichen" der Verteilung. Du mußt Dir das wie zwei Gaußsche Glockenkurven vorstellen, die ihre Mitte bei 2235 und 2274 haben und sich in ihren flacheren Randbereichen überlappen. Man könnte die Wahrscheinlichkeit dafür garantiert ausrechnen - nur ich kann es nicht... ![]() Daher meine großzügige Schätzung im Ursprungsposting, zu der mein Bauch nach wie vor steht... Nur beweisen kann ich es nicht ![]() Vielleicht finde ich demnächst mal etwas Zeit, in meine alten Statistik-Skripte reinzuschauen. Dann rechne ich es mal vor, bin selbst auf das Ergebnis gespannt! Oder ist hier jemand anderes, der den Kram noch nicht vergessen hat? ![]() Viele Grüße, Dirk Geändert von Supergrobi (13.05.2009 um 13:19 Uhr) |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Willi,
Ich weiss du willst nur den Mystery 32MHz ganz oben an der Spitze sehen ![]() Ich kann es noch nicht beenden, ich hab ein paar sachen ua. ein anderes Turnier das ich zuerst noch beenden muss! Ist aber noch alles Geheim ich will noch nichts darueber verraten bis es in ein paar Wochen beendet ist ![]() Viele Gruesse Nick ![]() ![]() ![]() Na, mach' mal - wird bestimmt wieder interessant... ![]() Gruß, Willi |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Nick,
Hallo Uwe,
Bei mir machten sie beide 6-7 abweichen pro spiel wenn ich meine das gleiche spiel zurueck spielen lasse. Das finde ich ein bischen zu viel. Dann bei Stellungstests gab es auch ein paar kleine abweichungen. Und zum schluss finde ich es noch schwer zu ertragen das der Magellan bei mir es auch geschafft hat gegen den Monte Carlo IV LE zu verlieren lol... was ja auch alles vielleicht zufall ist ![]() ![]() Ich hab mal ein Beispiel aus der CSS-Rangliste kopiert, nur um die Dimension mal sichtbar zu machen. 840 Partien in diesem Fall, das Gerät mit den meisten Partien unserer Aktivliste sind die GK2000 Clones mit 484 Partien, da wären also noch eine Menge Partien erforderlich. Code:
Thinker 4.7a 01.10.2004 [WB] Par- + = - Punk- Remis- Score Elo Elo + - 840 207 255 378 334,5 30,4% 39,8% 2656 2584 20 20 sollte man Partien, die im Autoplay Modus gespielt wurden, vergleichen. Ich habe hier mal eine Partie von Bernd aus dem Thread https://www.schachcomputer.info/foru...hlight=Atlanta genommen, ich konnte vor einiger Zeit eine Partie (mehr hab ich nicht getestet), einwandfrei mit meinem Magellan nachvollziehen. Allerdings spielt der Magellan diese Partie sehr!! schnell, 30 Sekunden pro Zug nimmt er sich auf keinen Fall, irgendwo so ab dem 15., 20. Zug geht das im 5 Sekunden Tempo weiter... komisch, aber die Partie ist zu 100% reproduzierbar.
[Event ""]
[Site "SZ3441309"] [Date "2007.12.24"] [Round "?"] [White "Magellan L030"] [Black "AutoPlay, Vorgabe 1.f3"] [Result "0-1"] [ECO "A00"] [Annotator ""] [PlyCount "140"] [TimeControl ""] 1. f3 d5 2. d4 e6 3. e3 Bd6 4. Ne2 Nf6 5. c4 dxc4 6. Qa4+ Bd7 7. Qxc4 e5 8. e4 exd4 9. Nxd4 Nc6 10. Be3 O-O 11. Nc3 Ne5 12. Qb3 c5 13. Ndb5 Be6 14. Qa3 Be7 15. Bxc5 Bxc5 16. Qxc5 Nfd7 17. Qf2 Qa5 18. Nd6 Nc5 19. O-O-O Rad8 20. Qg3 Ng6 21. Kb1 f5 22. Bb5 fxe4 23. fxe4 a6 24. Be2 Nf4 25. Rhe1 Na4 26. Nxa4 Qxa4 27. Qa3 Qxa3 28. bxa3 Nxe2 29. Rxe2 Bg4 30. Red2 Bxd1 31. Rxd1 Rf2 32. g3 Rxh2 33. Rd5 b6 34. Rd4 Rg2 35. Rd1 Rxg3 36. Kb2 h5 37. e5 Re3 38. Rd5 Rf8 39. Kc2 Rf2+ 40. Rd2 Rxd2+ 41. Kxd2 Rxa3 42. e6 Kf8 43. Nf5 g6 44. Nh4 Rg3 45. Ke2 Ke7 46. Kf2 Rg4 47. Ng2 Kxe6 48. Ne3 Ra4 49. a3 Rxa3 50. Nc4 Ra2+ 51. Ke3 b5 52. Nd2 a5 53. Ne4 b4 54. Kf4 a4 55. Nc5+ Kd5 56. Nd3 b3 57. Kg5 Kd4 58. Nb4 Rg2+ 59. Kf4 b2 60. Kf3 Rd2 61. Nc6+ Kc3 62. Kf4 b1=Q 63. Ne7 Qf1+ 64. Kg5 Rg2+ 65. Kh6 Qf8+ 66. Kh7 Qxe7+ 67. Kh6 Qf8+ 68. Kh7 Ra2 69. Kxg6 Rg2+ 70. Kxh5 Qh8# 0-1 ![]() so ähnlich wie hier, würde ich sagen. sollten in Partien auch keine größeren Abweichungen auftreten. ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter. Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir
![]() Mit dem Mystery sind sicher noch viel zu wenig Partien gespielt worden, sein Rating ist sicher stark geprägt von seinem guten Abschneiden bei der Online-WM, aber das kann sich auch noch ändern. Viele Grüße Uwe |
|
||||||||||||
AW: Atlanta oder Magellan?
![]() Da dürften die Meinungen aber heftig auseinandergehen. Ich will mir daher darüber erst garkeine Meinung bilden ausser: So viele Partien wie möglich! Zitieren:
2) Wie gross oder wie klein muesste die ELO differenz sein um zu sagen das 2 Geraete gleich sind?
Zitieren:
3) Wieviele abweichungen oder wie wenige muesste man haben in Ihren aktuellen Spielen? ... um zu behaupten das sie gleich sind oder nicht gleich sind.
Zitieren:
4) Reicht es wenn die Geraete den gleichen Chip haben, gleichen takt und gleichen buch? oder reicht es nicht?
Zitieren:
5) Was ist die toleranz bei stellungstest muss 100% oder weniger?
![]() Zitieren:
6) Wie entscheidet man wenn zB der fall vorkommen wuerde wo die Stellungstest gleich sind aber die Spiel abweichungen bei unter 90% liegen?
![]() Zitieren:
Ich glaube bei GM's oben an der spitze sind 42 ELO punkte ganz schoen viel.
![]() Zitieren:
ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter.
![]() Aus der Hauptgruppe rausfliegen bedeutet, gegen nominell schwächere Gegner antreten zu müssen als die in der A-Gruppe verbliebenen Geräte. Hier hat man dann Chancen auf mehr Punkte - Spielpunkte wie Elopunkte. Was an Elopunkten gewonnen oder verloren wird, unterliegt aber den gleichen Gesetzen (Formeln) wie auch in der A-Gruppe. Ich sehe hier keine Bevorteilung in irgendeiner Weise. Wenn es diese gäbe, müsste es logischerweise auch Benachteiligungen geben - worin sollen diese denn liegen? Zitieren:
Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir
![]() Aber um noch mal kurz auf die Klone zurück zu kommen und hierbei auch auf das Thema "Verschiedene Programmversionen": Ich halte es für richtig, Geräte auf ihre "Gleichheit" zu prüfen und sie bei Übereinstimmung zusammenzufassen - so wird das Abbild der Spielstärke aussagekräftiger. Ich halte es ferner für richtig, Geräte mit Abweichungen zu trennen - wenn diese Abweichungen gravierender Natur sind. Ich halte es aber keinesfalls für richtig, Geräte wegen irgendwelcher Kleinigkeiten zu trennen. Man mag jetzt darüber diskutieren, was noch als Kleinigkeit angesehen wird und was nicht - man kann es aber auch lassen! ![]() Es gibt z.B. Abweichungen zwischen Milano V1.01 und V1.02, die sich bei einzelnen Spielzügen bemerkbar machen. Ich habe nie getestet, ob es auch andere Lösezeiten gibt, aber ich wette darauf, dass es so sein wird. Trotzdem reden wir immer nur von "dem" Milano, als wenn es nur diesen einen gäbe. Aber das ist auch gut so, denn am Ende kommt sowieso nur ein unwesentlicher Spielstärke Unterschied heraus - die Dinger tun sich nichts. Warum hier trennen? Solche Unterschiede gibt es ganz sicher auch zwischen GK2100-Mystery-RS2250XL, nur sind sie dort schon deutlicher (beim Mystery meine ich das Proggi, nicht die Taktung). Gleiches gilt bei Maggi und Atlanta. Vielleicht relativiert sich irgendwann wieder alles und selbst die beiden letztgenannten werden wieder zusammengelegt? So, genug davon... muss heute was früher weg zur Arbeit. Gruß, Willi |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Dirk,
Hallo Uwe,
dann will ich mich mal versuchen (aber Achtung, richtig wissenschaftlich wird das nicht, kann mich nur noch teilweise an die Statistik-Vorlesungen erinnern): Nimmt man an, daß sich die wahre Elo-Zahl eines Geräts nach Spielen einer unendlichen Anzahl von Partien ergibt, basieren die Zahlen in unserer Liste auf einer (je nach Gerät unterschiedlich großen) Stichprobe. Deshalb gehen wir davon aus, daß wir noch einen Meßfehler in der Zahl drin haben - repräsentiert durch die Standardabweichung (also die +/- Zahl). Die Standardabweichungen in der Liste haben eine Sicherheit von 90%, d.h. mit einer Wahrscheinlichkeit von 90% liegt die tatsächliche Elo-Zahl innerhalb dieser Grenzen. (Wollte man es sicherer, müßte man größere Abweichungen angeben.) Atlanta hat 2274 +/- 42, Magellan hat 2235 +/- 28 Mit anderen Worten können wir mit 90% Sicherheit sagen, daß sich die wahre Elo-Zahl des Atlanta zwischen 2232 und 2316 befindet, die des Magellan zwischen 2207 und 2263. Die beiden Bereiche überschneiden sich, d.h. es ist durchaus möglich, daß beide Geräte gleich stark sind. Allerdings überschneiden sie sich nur in den "äußeren Bereichen" der Verteilung. Du mußt Dir das wie zwei Gaußsche Glockenkurven vorstellen, die ihre Mitte bei 2235 und 2274 haben und sich in ihren flacheren Randbereichen überlappen. Man könnte die Wahrscheinlichkeit dafür garantiert ausrechnen - nur ich kann es nicht... ![]() Daher meine großzügige Schätzung im Ursprungsposting, zu der mein Bauch nach wie vor steht... Nur beweisen kann ich es nicht ![]() Vielleicht finde ich demnächst mal etwas Zeit, in meine alten Statistik-Skripte reinzuschauen. Dann rechne ich es mal vor, bin selbst auf das Ergebnis gespannt! Oder ist hier jemand anderes, der den Kram noch nicht vergessen hat? ![]() Viele Grüße, Dirk ![]() ![]() Viele Grüße Uwe |
|
||||||||||||
AW: Atlanta oder Magellan?
Es gibt z.B. Abweichungen zwischen Milano V1.01 und V1.02, die sich bei einzelnen Spielzügen bemerkbar machen. Ich habe nie getestet, ob es auch andere Lösezeiten gibt, aber ich wette darauf, dass es so sein wird. Trotzdem reden wir immer nur von "dem" Milano, als wenn es nur diesen einen gäbe. Aber das ist auch gut so, denn am Ende kommt sowieso nur ein unwesentlicher Spielstärke Unterschied heraus - die Dinger tun sich nichts. Warum hier trennen? Solche Unterschiede gibt es ganz sicher auch zwischen GK2100-Mystery-RS2250XL, nur sind sie dort schon deutlicher (beim Mystery meine ich das Proggi, nicht die Taktung). Gleiches gilt bei Maggi und Atlanta. Vielleicht relativiert sich irgendwann wieder alles und selbst die beiden letztgenannten werden wieder zusammengelegt
das ist auch mein Standpunkt. Ein Unterschied von +/-20 ELOs kann man tolerieren und die Kisten zusammenfassen. Ansonsten würde die Liste vollkommen unübersichtlich. Beispiel 1: Siehe oben - die Milano-Versionen. Gleiches gilt für Polgar, MM..Module oder diverse Lang WM Module. Geprüft hat hier noch keiner die Veränderungen der einzelnen Versionen, aber sie dürften gering ausfallen. Beispiel 2: Chessmachine, RISC 2500, Montreux! Wie bekannt sind die Dinger auch mit verschiedenen Bausteinen (Mhz/RAM) bestückt, also ergibt sich auch ein Unterschied in Lösungszeiten und/oder gespielten Zügen. Aber deswegen aufsplitten? Andererseits wird z.B. der Super Forte/Expert mit 5Mhz und 6Mhz getrennt gewertet. Falls diese sich auf "längere" Sicht, sprich mehr Partien, wieder annähern wäre ein gemeinsamer ELO-Wert mMn. auch hier sinnvoll. Schwierig wird es halt immer dann, wenn die technischen Angaben nicht sofort verifizierbar sind. Wer schraubt schon direkt einen Excellence (3,4 oder 5MHz) oder Constellation Expert (4 und 5MHz bekannt) auf bevor er seine Partien zur Auswertung freigibt. Stellungstests (BT-Test, Colditz) zum Vergleich sind mir da wesentlich lieber. Gruß, Peter |
|
||||||||||||
AW: Atlanta oder Magellan?
Hallo Peter,
Gruß, Micha |
![]() |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Test: Wer ist der Endspielkönner: Lyon, London, Magellan oder Risc I? | bbbk | Teststellungen und Elo Listen / Test positions and Elo lists | 4 | 10.01.2009 14:30 |
Test: Klon Test Magellan - Atlanta | spacious_mind | Die ganze Welt der Schachcomputer / World of chess computers | 61 | 06.02.2008 23:31 |
Frage: Magellan Eröffnungsfehler oder ..? | OrinokoRM | Teststellungen und Elo Listen / Test positions and Elo lists | 4 | 08.12.2007 19:00 |
Frage: Star Diamond oder Atlanta | mclane | Die ganze Welt der Schachcomputer / World of chess computers | 25 | 21.09.2005 15:59 |