Schachcomputer.info Community

Schachcomputer.info Community (https://www.schachcomputer.info/forum/index.php)
-   Die ganze Welt der Schachcomputer / World of chess computers (https://www.schachcomputer.info/forum/forumdisplay.php?f=2)
-   -   Frage: Atlanta oder Magellan? (https://www.schachcomputer.info/forum/showthread.php?t=2459)

spacious_mind 13.05.2009 00:23

AW: Atlanta oder Magellan?
 
Zitieren:

Zitat von Paisano (Beitrag 19376)
Hallo Dirk,kannst Du mal etwas näher erläutern, wie Du darauf kommst ?

Völlig "unwissenschaftlich" würde ich die Zahlen in der Aktivliste mal so interpretieren:

- der Abstand zwischen Mag und Atlanta hat sich verringert
- der Atlanta hat (leider) immer noch eine relativ geringe Anzahl Partien absolviert (Toleranz 42 !)
- der Gegnerdurchschnitt des Atlanta liegt um über 40 Punkte unter dem des Mag

Also eigentlich läuft das mMn eher auf eine Annäherung hin, auch wenn man berücksichtigt, dass die beiden Programme
nicht absolut identisch sind und eine gewisse Differenz immer vorhanden sein wird.

Aber ob die noch relevant sein wird ??

Viele Grüße
Uwe

Hallo Uwe,

Bei mir machten sie beide 6-7 abweichen pro spiel wenn ich meine das gleiche spiel zurueck spielen lasse. Das finde ich ein bischen zu viel. Dann bei Stellungstests gab es auch ein paar kleine abweichungen. Und zum schluss finde ich es noch schwer zu ertragen das der Magellan bei mir es auch geschafft hat gegen den Monte Carlo IV LE zu verlieren lol... was ja auch alles vielleicht zufall ist :)

Aber jetzt ein paar ernste Fragen zu klons.

1) Wieviele Spiele muessten man brauchen um genuegend zu haben fuer irgendeine aussage?
2) Wie gross oder wie klein muesste die ELO differenz sein um zu sagen das 2 Geraete gleich sind?
3) Wieviele abweichungen oder wie wenige muesste man haben in Ihren aktuellen Spielen? ... um zu behaupten das sie gleich sind oder nicht gleich sind.
4) Reicht es wenn die Geraete den gleichen Chip haben, gleichen takt und gleichen buch? oder reicht es nicht?
5) Was ist die toleranz bei stellungstest muss 100% oder weniger?
6) Wie entscheidet man wenn zB der fall vorkommen wuerde wo die Stellungstest gleich sind aber die Spiel abweichungen bei unter 90% liegen?

Ich glaube bei GM's oben an der spitze sind 42 ELO punkte ganz schoen viel.

ps. Es wuerde mich mal richtig interessieren wenn mann die ersten 192 spiele, die mittleren 192 spiele und die letzten 192 spiele die Micha hat mal vergleichen wuerde um zu sehen wie diese 3 ELO Werte aussehen gegenueber den Atlanta. Und auch noch vielleicht nur alle Spiele nehmen wo sie beide den gleichen Gegner gespielt haben. Waere interessant zu sehen wie die ELO's dann bei den beiden aussehen als vergleich.

ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter. Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir :)


Viele Gruesse

Nick

Tom 13.05.2009 06:47

AW: Atlanta oder Magellan?
 
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
Hallo Uwe,

Bei mir machten sie beide 6-7 abweichen pro spiel wenn ich meine das gleiche spiel zurueck spielen lasse. Das finde ich ein bischen zu viel. Dann bei Stellungstests gab es auch ein paar kleine abweichungen.
...
Nick

Hallo Nick,

ich finde Deine Ausführungen sehr interessant.
Könntest Du (wenn Du Zeit hast) ein oder zwei Beispiele von Stellungen bringen, bei denen der Atlanta und der Magellan unterschiedlich reagieren?

Ich meine, dass Clones selbst im Spiel gegen gleiche Geräte, also Atlanta gegen Mystery bzw. Magellan gegen Mystery, unterschiedliche Ergebnisse bringen können, aber bei vorgegebenen Stellungen und gleichen Einstellungen der Clones sollten doch die gleichen Ergebnisse herauskommen, oder?

Grüße Tom

Robert 13.05.2009 08:55

AW: Atlanta oder Magellan?
 
Hallo Tom,

ich bin zwar nicht Nick, aber ich kann auch ein bisschen was zu der Diskussion beitragen.;)

Zitieren:

Zitat von Tom (Beitrag 19397)
ich finde Deine Ausführungen sehr interessant.
Könntest Du (wenn Du Zeit hast) ein oder zwei Beispiele von Stellungen bringen, bei denen der Atlanta und der Magellan unterschiedlich reagieren?

Da braucht man ja nur KLS-K spielen; das haben die beiden bei mir unterschiedlich gespielt. Auf 30s/avg. hat der Magellan einen oder zwei Züge mehr gebraucht (natürlich bei gleicher Ausgangsstellung)
Zitieren:

Ich meine, dass Clones selbst im Spiel gegen gleiche Geräte, also Atlanta gegen Mystery bzw. Magellan gegen Mystery, unterschiedliche Ergebnisse bringen können, aber bei vorgegebenen Stellungen und gleichen Einstellungen der Clones sollten doch die gleichen Ergebnisse herauskommen, oder?
Sollte man meinen!

Vielleicht gibt es ja auch identische Atlantas und Magellans, aber das ist schwer festzustellen. Wir wissen ja nicht, ob, und wenn ja, wieviele unterschiedliche Programmversionen im Umlauf sind.

Man müsste mal Testergebnisse von allen Atlantas und Magellans, die hier im Forum "unterwegs" sind, sammeln; evtl. könnte man damit identische Versionen finden.

Wenn das der Fall wäre, müssten wir nicht mehr nach Atlanta und Magellan unterscheiden, sondern nach Atlanta/Magellan "A", "B", "C" usw.

Und dann kriegen wir wieder die altbekannte Diskussion, ob eine solche Diskussion sinnvoll ist oder nicht...;)


viele Grüße,
Robert

Supergrobi 13.05.2009 13:15

AW: Atlanta oder Magellan?
 
Zitieren:

Zitat von Paisano (Beitrag 19376)
Hallo Dirk,kannst Du mal etwas näher erläutern, wie Du darauf kommst ?

Hallo Uwe,

dann will ich mich mal versuchen (aber Achtung, richtig wissenschaftlich wird das nicht, kann mich nur noch teilweise an die Statistik-Vorlesungen erinnern):

Nimmt man an, daß sich die wahre Elo-Zahl eines Geräts nach Spielen einer unendlichen Anzahl von Partien ergibt, basieren die Zahlen in unserer Liste auf einer (je nach Gerät unterschiedlich großen) Stichprobe. Deshalb gehen wir davon aus, daß wir noch einen Meßfehler in der Zahl drin haben - repräsentiert durch die Standardabweichung (also die +/- Zahl).

Die Standardabweichungen in der Liste haben eine Sicherheit von 90%, d.h. mit einer Wahrscheinlichkeit von 90% liegt die tatsächliche Elo-Zahl innerhalb dieser Grenzen. (Wollte man es sicherer, müßte man größere Abweichungen angeben.)

Atlanta hat 2274 +/- 42,
Magellan hat 2235 +/- 28

Mit anderen Worten können wir mit 90% Sicherheit sagen, daß sich die wahre Elo-Zahl des Atlanta zwischen 2232 und 2316 befindet, die des Magellan zwischen 2207 und 2263.

Die beiden Bereiche überschneiden sich, d.h. es ist durchaus möglich, daß beide Geräte gleich stark sind. Allerdings überschneiden sie sich nur in den "äußeren Bereichen" der Verteilung. Du mußt Dir das wie zwei Gaußsche Glockenkurven vorstellen, die ihre Mitte bei 2235 und 2274 haben und sich in ihren flacheren Randbereichen überlappen. Man könnte die Wahrscheinlichkeit dafür garantiert ausrechnen - nur ich kann es nicht... :o

Daher meine großzügige Schätzung im Ursprungsposting, zu der mein Bauch nach wie vor steht... Nur beweisen kann ich es nicht ;)

Vielleicht finde ich demnächst mal etwas Zeit, in meine alten Statistik-Skripte reinzuschauen. Dann rechne ich es mal vor, bin selbst auf das Ergebnis gespannt!

Oder ist hier jemand anderes, der den Kram noch nicht vergessen hat? :raffnix:

Viele Grüße,
Dirk

EberlW 13.05.2009 20:53

AW: Atlanta oder Magellan?
 
Zitieren:

Zitat von spacious_mind (Beitrag 19393)
Hallo Willi,

Ich weiss du willst nur den Mystery 32MHz ganz oben an der Spitze sehen :)

Ich kann es noch nicht beenden, ich hab ein paar sachen ua. ein anderes Turnier das ich zuerst noch beenden muss! Ist aber noch alles Geheim ich will noch nichts darueber verraten bis es in ein paar Wochen beendet ist :p

Viele Gruesse

Nick

Ach was - der Mystery wird am Atlanta keinesfalls vorbei kommen... :D

:motz: Du immer und Deine Geheimniskrämerei!!! ;)
Na, mach' mal - wird bestimmt wieder interessant... :)

Gruß, Willi

Paisano 13.05.2009 21:20

AW: Atlanta oder Magellan?
 
Hallo Nick,
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
Hallo Uwe,

Bei mir machten sie beide 6-7 abweichen pro spiel wenn ich meine das gleiche spiel zurueck spielen lasse. Das finde ich ein bischen zu viel. Dann bei Stellungstests gab es auch ein paar kleine abweichungen. Und zum schluss finde ich es noch schwer zu ertragen das der Magellan bei mir es auch geschafft hat gegen den Monte Carlo IV LE zu verlieren lol... was ja auch alles vielleicht zufall ist :)

ich glaube gerne, dass die beiden nicht absolut identisch sind. Mir ging es primär um die Frage, sind die Unterschiede so gross, dass sie sich spürbar auf die Spielstärke auswirken.
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
Aber jetzt ein paar ernste Fragen zu klons.

1) Wieviele Spiele muessten man brauchen um genuegend zu haben fuer irgendeine aussage?
2) Wie gross oder wie klein muesste die ELO differenz sein um zu sagen das 2 Geraete gleich sind?

Diese beiden Fragen kann ich zusammen beantworten; meiner Meinung nach sollte die Toleranz nicht mehr als +/-20 betragen, aber dafür braucht man eine Menge Partien:mad:.
Ich hab mal ein Beispiel aus der CSS-Rangliste kopiert, nur um die Dimension mal sichtbar zu machen. 840 Partien in diesem Fall, das Gerät mit den meisten Partien unserer
Aktivliste sind die GK2000 Clones mit 484 Partien, da wären also noch eine Menge Partien erforderlich.
Code:

Thinker 4.7a          01.10.2004 [WB]
Par-  +  =  - Punk- Remis- Score  Elo Elo  +  -
840 207 255 378 334,5 30,4% 39,8% 2656 2584 20  20

Zitieren:

Zitat von spacious_mind (Beitrag 19395)
3) Wieviele abweichungen oder wie wenige muesste man haben in Ihren aktuellen Spielen? ... um zu behaupten das sie gleich sind oder nicht gleich sind.

Hier sollten wir unterscheiden zwischen manuell gespielten Partien und Autoplay Partien. Um die unvermeidliche Fehlertoleranz bei manuellen Partien auszuschliessen,
sollte man Partien, die im Autoplay Modus gespielt wurden, vergleichen. Ich habe hier mal eine Partie von Bernd aus dem Thread https://www.schachcomputer.info/foru...hlight=Atlanta
genommen, ich konnte vor einiger Zeit eine Partie (mehr hab ich nicht getestet), einwandfrei mit meinem Magellan nachvollziehen. Allerdings spielt der Magellan diese Partie sehr!! schnell,
30 Sekunden pro Zug nimmt er sich auf keinen Fall, irgendwo so ab dem 15., 20. Zug geht das im 5 Sekunden Tempo weiter... komisch, aber die Partie ist zu 100% reproduzierbar.

[Event ""]
[Site "SZ3441309"]
[Date "2007.12.24"]
[Round "?"]
[White "Magellan L030"]
[Black "AutoPlay, Vorgabe 1.f3"]
[Result "0-1"]
[ECO "A00"]
[Annotator ""]
[PlyCount "140"]
[TimeControl ""]

1. f3 d5 2. d4 e6 3. e3 Bd6 4. Ne2
Nf6 5. c4 dxc4 6. Qa4+ Bd7 7. Qxc4 e5 8. e4 exd4 9. Nxd4 Nc6 10. Be3 O-O 11.
Nc3 Ne5 12. Qb3 c5 13. Ndb5 Be6 14. Qa3 Be7 15. Bxc5 Bxc5 16. Qxc5 Nfd7 17. Qf2
Qa5 18. Nd6 Nc5 19. O-O-O Rad8 20. Qg3 Ng6 21. Kb1 f5 22. Bb5 fxe4 23. fxe4 a6
24. Be2 Nf4 25. Rhe1 Na4 26. Nxa4 Qxa4 27. Qa3 Qxa3 28. bxa3 Nxe2 29. Rxe2 Bg4
30. Red2 Bxd1 31. Rxd1 Rf2 32. g3 Rxh2 33. Rd5 b6 34. Rd4 Rg2 35. Rd1 Rxg3 36.
Kb2 h5 37. e5 Re3 38. Rd5 Rf8 39. Kc2 Rf2+ 40. Rd2 Rxd2+ 41. Kxd2 Rxa3 42. e6
Kf8 43. Nf5 g6 44. Nh4 Rg3 45. Ke2 Ke7 46. Kf2 Rg4 47. Ng2 Kxe6 48. Ne3 Ra4 49.
a3 Rxa3 50. Nc4 Ra2+ 51. Ke3 b5 52. Nd2 a5 53. Ne4 b4 54. Kf4 a4 55. Nc5+ Kd5
56. Nd3 b3 57. Kg5 Kd4 58. Nb4 Rg2+ 59. Kf4 b2 60. Kf3 Rd2 61. Nc6+ Kc3 62. Kf4
b1=Q 63. Ne7 Qf1+ 64. Kg5 Rg2+ 65. Kh6 Qf8+ 66. Kh7 Qxe7+ 67. Kh6 Qf8+ 68. Kh7
Ra2 69. Kxg6 Rg2+ 70. Kxh5 Qh8# 0-1
,
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
4) Reicht es wenn die Geraete den gleichen Chip haben, gleichen takt und gleichen buch? oder reicht es nicht?

Ein klares nein
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
5) Was ist die toleranz bei stellungstest muss 100% oder weniger?

https://www.schachcomputer.info/Bild...a_magellan.jpg

so ähnlich wie hier, würde ich sagen.
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
6) Wie entscheidet man wenn zB der fall vorkommen wuerde wo die Stellungstest gleich sind aber die Spiel abweichungen bei unter 90% liegen?

Keine Ahnung, eigentlich sollte das ja nicht passieren, wenn Stellungstests mit einer ausreichenden Anzahl von Teststellungen mit sagen wir mal zu 98% gleiche Ergebnisse bringen,
sollten in Partien auch keine größeren Abweichungen auftreten.
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
ps. Es wuerde mich mal richtig interessieren wenn mann die ersten 192 spiele, die mittleren 192 spiele und die letzten 192 spiele die Micha hat mal vergleichen wuerde um zu sehen wie diese 3 ELO Werte aussehen gegenueber den Atlanta.

Was meinst Du mit den ersten 192, den mittleren 192 usw.?
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
Und auch noch vielleicht nur alle Spiele nehmen wo sie beide den gleichen Gegner gespielt haben. Waere interessant zu sehen wie die ELO's dann bei den beiden aussehen als vergleich.

ja, das wäre wirklich interessant.
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter. Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir :)

Das sehe ich eher andersherum, Nick. Gerade der Atlanta hat in den Online WM's immer relativ gut abgeschnitten und durch Siege gegen stärker eingestufte Geräte sicher gut profitiert.
Mit dem Mystery sind sicher noch viel zu wenig Partien gespielt worden, sein Rating ist sicher stark geprägt von seinem guten Abschneiden bei der Online-WM, aber das kann sich auch noch ändern.

Viele Grüße
Uwe

EberlW 13.05.2009 21:56

AW: Atlanta oder Magellan?
 
Zitieren:

Zitat von spacious_mind (Beitrag 19395)
Aber jetzt ein paar ernste Fragen zu klons.

1) Wieviele Spiele muessten man brauchen um genuegend zu haben fuer irgendeine aussage?

Meinst Du DIESE Frage wirklich ernst? ;)
Da dürften die Meinungen aber heftig auseinandergehen. Ich will mir daher darüber erst garkeine Meinung bilden ausser: So viele Partien wie möglich!
Zitieren:

2) Wie gross oder wie klein muesste die ELO differenz sein um zu sagen das 2 Geraete gleich sind?
Wenn man zuvor eine ordentliche Ladung Korinthen zu sich genommen hat, sollte man meinen, die Differenz habe NULL zu betragen. Ich persönlich finde, die verschiedenen Konfigurationen, Gegner, Bedienzeiten etc... erlauben leicht eine Toleranz von bis zu 20 Elos (auch wenn das viel erscheinen mag).
Zitieren:

3) Wieviele abweichungen oder wie wenige muesste man haben in Ihren aktuellen Spielen? ... um zu behaupten das sie gleich sind oder nicht gleich sind.
Abweichungen können schnell durch unterschiedliche Bedienzeiten auftreten (sofern das Pondern eingeschaltet ist). Ich denke, so 2-3 Abweichungen lassen sich kaum vermeiden, selbst bei absolut identischen Geräten nicht.
Zitieren:

4) Reicht es wenn die Geraete den gleichen Chip haben, gleichen takt und gleichen buch? oder reicht es nicht?
Natürlich nicht, denn das Proggi selbst KANN immer noch ein anderes sein.
Zitieren:

5) Was ist die toleranz bei stellungstest muss 100% oder weniger?
Auch hier gibt es Ableseungenauigkeiten, die am Bediener liegen. Wer von uns ist fehlerfrei? Man müsste zwei Probanden schon GLEICHZEITIG testen um solchen Eventualitäten aus dem Weg zu gehen. Liest man dabei falsch ab, trifft es wenigstens beide Geräte gleichzeitig... :D
Zitieren:

6) Wie entscheidet man wenn zB der fall vorkommen wuerde wo die Stellungstest gleich sind aber die Spiel abweichungen bei unter 90% liegen?
Ich halte diese Konstellation für weitgehend unwahrscheinlich - hast Du konkrete (real aufgetretene) Beispiele für sowas, oder war die Frage nur einfach so in den Raum geworfen? :)
Zitieren:

Ich glaube bei GM's oben an der spitze sind 42 ELO punkte ganz schoen viel.
GM's sind Menschen - bei Compis gelten andere Gesetze... :D
Zitieren:

ach ja, letzter ps.. zu diesen Beitrag. Ich finde das die Geraete die in der A-WM ausgeschieden sind ganz schoen profitieren wenn sie im B-WM weiter spielen bis zum halb-finale und weiter.
:confused: Aber das liegt doch in der Natur der Dinge:
Aus der Hauptgruppe rausfliegen bedeutet, gegen nominell schwächere Gegner antreten zu müssen als die in der A-Gruppe verbliebenen Geräte. Hier hat man dann Chancen auf mehr Punkte - Spielpunkte wie Elopunkte. Was an Elopunkten gewonnen oder verloren wird, unterliegt aber den gleichen Gesetzen (Formeln) wie auch in der A-Gruppe. Ich sehe hier keine Bevorteilung in irgendeiner Weise. Wenn es diese gäbe, müsste es logischerweise auch Benachteiligungen geben - worin sollen diese denn liegen?
Zitieren:

Wieviele ELO punkte mehr hat der Mystery 32 im B-WM gewonnen gegenueber wie er Spielte im A-WM. Das gleiche mit den Magellan. Das B-WM hat ihn geholfen bestimmt sonst waere der abstand zwischen Ihn und den Atlanta bestimmt hoeher wie es vorher war. Das sind aber alles wie was und wo aussagen von mir :)
Der Mystery (nur um mal bei diesem Beispiel zu bleiben) hätte bei einem nur leicht anderen Ausgangsfeld auch schon im Achtelfinale an den Lyon geraten und rausfliegen können - was wäre dann gewesen? Und das der Abstand Maggi-Atlanta schrumpfte, lag doch nicht zuletzt auch daran, dass der Atlanta Punkte abgegeben hat, oder? In der nächsten Liste kann (und wird) sowieso wieder alles anders aussehen.

Aber um noch mal kurz auf die Klone zurück zu kommen und hierbei auch auf das Thema "Verschiedene Programmversionen":

Ich halte es für richtig, Geräte auf ihre "Gleichheit" zu prüfen und sie bei Übereinstimmung zusammenzufassen - so wird das Abbild der Spielstärke aussagekräftiger.

Ich halte es ferner für richtig, Geräte mit Abweichungen zu trennen - wenn diese Abweichungen gravierender Natur sind.

Ich halte es aber keinesfalls für richtig, Geräte wegen irgendwelcher Kleinigkeiten zu trennen. Man mag jetzt darüber diskutieren, was noch als Kleinigkeit angesehen wird und was nicht - man kann es aber auch lassen! ;)

Es gibt z.B. Abweichungen zwischen Milano V1.01 und V1.02, die sich bei einzelnen Spielzügen bemerkbar machen. Ich habe nie getestet, ob es auch andere Lösezeiten gibt, aber ich wette darauf, dass es so sein wird. Trotzdem reden wir immer nur von "dem" Milano, als wenn es nur diesen einen gäbe. Aber das ist auch gut so, denn am Ende kommt sowieso nur ein unwesentlicher Spielstärke Unterschied heraus - die Dinger tun sich nichts. Warum hier trennen? Solche Unterschiede gibt es ganz sicher auch zwischen GK2100-Mystery-RS2250XL, nur sind sie dort schon deutlicher (beim Mystery meine ich das Proggi, nicht die Taktung). Gleiches gilt bei Maggi und Atlanta. Vielleicht relativiert sich irgendwann wieder alles und selbst die beiden letztgenannten werden wieder zusammengelegt?

So, genug davon... muss heute was früher weg zur Arbeit.
Gruß, Willi

Paisano 13.05.2009 22:06

AW: Atlanta oder Magellan?
 
Hallo Dirk,
Zitieren:

Zitat von Supergrobi (Beitrag 19409)
Hallo Uwe,

dann will ich mich mal versuchen (aber Achtung, richtig wissenschaftlich wird das nicht, kann mich nur noch teilweise an die Statistik-Vorlesungen erinnern):

Nimmt man an, daß sich die wahre Elo-Zahl eines Geräts nach Spielen einer unendlichen Anzahl von Partien ergibt, basieren die Zahlen in unserer Liste auf einer (je nach Gerät unterschiedlich großen) Stichprobe. Deshalb gehen wir davon aus, daß wir noch einen Meßfehler in der Zahl drin haben - repräsentiert durch die Standardabweichung (also die +/- Zahl).

Die Standardabweichungen in der Liste haben eine Sicherheit von 90%, d.h. mit einer Wahrscheinlichkeit von 90% liegt die tatsächliche Elo-Zahl innerhalb dieser Grenzen. (Wollte man es sicherer, müßte man größere Abweichungen angeben.)

Atlanta hat 2274 +/- 42,
Magellan hat 2235 +/- 28

Mit anderen Worten können wir mit 90% Sicherheit sagen, daß sich die wahre Elo-Zahl des Atlanta zwischen 2232 und 2316 befindet, die des Magellan zwischen 2207 und 2263.

Die beiden Bereiche überschneiden sich, d.h. es ist durchaus möglich, daß beide Geräte gleich stark sind. Allerdings überschneiden sie sich nur in den "äußeren Bereichen" der Verteilung. Du mußt Dir das wie zwei Gaußsche Glockenkurven vorstellen, die ihre Mitte bei 2235 und 2274 haben und sich in ihren flacheren Randbereichen überlappen. Man könnte die Wahrscheinlichkeit dafür garantiert ausrechnen - nur ich kann es nicht... :o

Daher meine großzügige Schätzung im Ursprungsposting, zu der mein Bauch nach wie vor steht... Nur beweisen kann ich es nicht ;)

Vielleicht finde ich demnächst mal etwas Zeit, in meine alten Statistik-Skripte reinzuschauen. Dann rechne ich es mal vor, bin selbst auf das Ergebnis gespannt!

Oder ist hier jemand anderes, der den Kram noch nicht vergessen hat? :raffnix:

Viele Grüße,
Dirk

Du hast das schon sehr verständlich rübergebracht:top:, mir ist jetzt einiges klarer, die Sache mit der 90% Wahrscheinlichkeiit bei den Toleranzen wusste ich noch nicht (steht sicher in den Erläuterungen zur Elo-Liste:o).

Viele Grüße
Uwe

Fluppio 13.05.2009 22:33

AW: Atlanta oder Magellan?
 
Zitieren:

Zitat von EberlW (Beitrag 19422)
Es gibt z.B. Abweichungen zwischen Milano V1.01 und V1.02, die sich bei einzelnen Spielzügen bemerkbar machen. Ich habe nie getestet, ob es auch andere Lösezeiten gibt, aber ich wette darauf, dass es so sein wird. Trotzdem reden wir immer nur von "dem" Milano, als wenn es nur diesen einen gäbe. Aber das ist auch gut so, denn am Ende kommt sowieso nur ein unwesentlicher Spielstärke Unterschied heraus - die Dinger tun sich nichts. Warum hier trennen? Solche Unterschiede gibt es ganz sicher auch zwischen GK2100-Mystery-RS2250XL, nur sind sie dort schon deutlicher (beim Mystery meine ich das Proggi, nicht die Taktung). Gleiches gilt bei Maggi und Atlanta. Vielleicht relativiert sich irgendwann wieder alles und selbst die beiden letztgenannten werden wieder zusammengelegt

Hi Willi,

das ist auch mein Standpunkt. Ein Unterschied von +/-20 ELOs kann man tolerieren und die Kisten zusammenfassen. Ansonsten würde die Liste vollkommen unübersichtlich.

Beispiel 1: Siehe oben - die Milano-Versionen. Gleiches gilt für Polgar, MM..Module oder diverse Lang WM Module. Geprüft hat hier noch keiner die Veränderungen der einzelnen Versionen, aber sie dürften gering ausfallen.

Beispiel 2: Chessmachine, RISC 2500, Montreux! Wie bekannt sind die Dinger auch mit verschiedenen Bausteinen (Mhz/RAM) bestückt, also ergibt sich auch ein Unterschied in Lösungszeiten und/oder gespielten Zügen. Aber deswegen aufsplitten?
Andererseits wird z.B. der Super Forte/Expert mit 5Mhz und 6Mhz getrennt gewertet. Falls diese sich auf "längere" Sicht, sprich mehr Partien, wieder annähern wäre ein gemeinsamer ELO-Wert mMn. auch hier sinnvoll.

Schwierig wird es halt immer dann, wenn die technischen Angaben nicht sofort verifizierbar sind. Wer schraubt schon direkt einen Excellence (3,4 oder 5MHz) oder Constellation Expert (4 und 5MHz bekannt) auf bevor er seine Partien zur Auswertung freigibt.

Stellungstests (BT-Test, Colditz) zum Vergleich sind mir da wesentlich lieber.

Gruß, Peter

Chessguru 13.05.2009 23:48

AW: Atlanta oder Magellan?
 
Hallo Peter,
Zitieren:

Zitat von Fluppio (Beitrag 19424)
Beispiel 2: Chessmachine, RISC 2500, Montreux! Wie bekannt sind die Dinger auch mit verschiedenen Bausteinen (Mhz/RAM) bestückt, also ergibt sich auch ein Unterschied in Lösungszeiten und/oder gespielten Zügen. Aber deswegen aufsplitten?

ich stimme vielen deiner Aussagen zu, aber RISC 2500 und Montreux sind vom Programm 2 verschiedene Varianten. Solche Geräte kann man unmöglich zusammenfassen. Auch wenn die Hardware identisch sein sollte bzw. bei den beiden Varianten ist, so reicht das doch noch lange nicht als Kriterium, um eine Zusammenlegung zu rechtfertigen.

Gruß,
Micha


Alle Zeitangaben in WEZ +2. Es ist jetzt 14:13 Uhr.

Powered by vBulletin (Deutsch)
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
©Schachcomputer.info