|
||||||||||||
AW: Klon Test Magellan - Atlanta
Hallo an alle,
Wenn die maschinen menschen waeren dann wuerde jeder heute ein streit machen ![]() Weil in unsere rechtliche Welt da lautet es "innocent until proven guilty" aber bei unsere schachcomputer da heisst es "guilty until proven innocent" oder until "an expert says differently". Wer ist den der expert der sagt es muss so oder so sein? Das buendeln von schach computers stoert mich schon immer. Stellungstest ist auch nur ein test der auch nicht alles sagen kann. Es ist ja klar das alle aehnlichen programme mit gleicher geschwindingkeit die fast gleichen zahlen bekommen werden. Versuche es mal mit zb Engines version 1.1 gegen version 1.2 usw das sieht ihr kaum was in stellung tests aber die werden seperat gelistet und haben einen anderen elo auf listen auch wenn es nur 10 punkte differenzen gibt. Wieso versuchen wir unser hobby staendig zu vereinfachen? Niemand eilt uns was ist so verkehrt wenn man zb bestimmte geraete trennt und vergleicht gegen das bundeln resultat? Um in meine augen ein klon zu sein da muss die maschine mehr beweisen als nur ein stellung test, dazu gehoeren mehere stufen sonst ist er NIEMALS EIN KLON. 1) Stellungstest = gleich (magellan - atlanta sind nicht gleich 10 von 40 aweichungen bei die maschinen von Micha = 25 %) plus 2) Sie muessen durch spiel wiederholung 95%+ duschnittlich erreichen. Ich wiederhole meisstens 3 spiele und der durschnitt muss bei ca 95% liegen. (Atlanta - magellan sind hier auch wieder nicht gleich) Ich glaube auch das mehr leute sich muehe geben wuerden mit spiele wenn Ihr geraet getrennt ist. Ein klon muss ein klarer fall sein sowie Cosmos/ETC/Centurion/ usw diese erfuellen beide tests jedesmal ob ich sie teste oder micha, robert, tom usw. Bei Magellan und Atlanta da wird keiner von uns mit unseren geraeten den klon test erfuellen koennen. Sie muessen seperat gelistet sein bis sie was anderes beweisen. Mir ist es egal was die hersteller schreiben, meistens ist es sowieso schrott heutzutage ![]() Die feinheiten und kleine verbesserungen im mittlespiel oder endspiel werden wir nie erleben und vergnuegen mit haben wenn alles was fraglich gebuendelt ist. Ich hab bis jetzt 10 spiele gespielt zwischen Magellan - Atlanta (6 gegen den magellan 24mhz von Eric). Es sind 2 unique persoenlichkeiten die hier spielen das sieht man in jedes spiel. Es ist einfach schade sie zu buendeln. Micha's stellungstest sagt dieses auch 10 von 40 abweichungen ist zu hoch. Viele gruesse Nick Geändert von spacious_mind (21.01.2008 um 16:43 Uhr) |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
![]() Ich hab bis jetzt 10 spiele gespielt zwischen Magellan - Atlanta (6 gegen den magellan 24mhz von Eric). Es sind 2 unique persoenlichkeiten die hier spielen das sieht man in jedes spiel. Es ist einfach schade sie zu buendeln. Micha's stellungstest sagt dieses auch 10 von 40 abweichungen ist zu hoch.
Wenn man es genau nimmt, müsste jeder, der Partien zu unseren ELO-Listen beiträgt, alle seine Rechner durch den BT-Test jagen, um festzustellen, ob er vielleicht eine andere Version als die anderen hat! (schließlich muss der Operator ja seine Version angeben, damit man sie extra bewerten kann) Würden wir dies machen, hätten wir am Schluss vielleicht 10 verschiedene Atlanta/Magellan-Versionen, die sich aber nur marginal voneinander unterscheiden und pro Version vielleicht 10 Partien, die einfach zu wenig sind, um eine vernünftige ELO-Zahl zu berechnen. Selbst die Versionen, die Micha getestet hat und die du als unterschiedlich einstufst, haben praktisch identische Endergebnisse erzielt! Vergleiche doch mal, wie sehr sich zwei Rechner in den Einzelzeiten unterscheiden müssen, um wirklich deutlich unterschiedliche Endergebnisse zu erzielen. Und es kommt doch letztlich nur auf ein möglichst exaktes Endergebnis an, oder? Und selbst eine Differenz von +/- 50 ELO (was schon sehr viel wäre), kann durch die Varianz/Schwankungsbreite erklärt werden. Das bedeutet, selbst zwei absolut identische Klone können einmal 2000 und ein anderes mal 2100 ELO erzielen. Und um dies zu reduzieren, brauchen wir möglichst viele Partien, die wir (zumindest jetzt noch) nur durch Zusammenlegung bekommen. Und wie ich schon mehrfach schrieb: Es geht ja nicht nur um Unterschiede zwischen Atlanta und Magellan, sondern auch um Differenzen zwischen Atlanta und Atlanta bzw. Magellan und Magellan! Das müsste auch noch geklärt werden! Wo will man da anfangen? Wie Micha schon schrieb: Dadurch schafft man bei potentiellen Käufern dieser Rechner nur unnötige Verwirrung... Es gäbe da viel einfacher zu unterscheidende Rechner, bei denen wir sicher sind, dass es unterschiedliche Versionen gibt, weil man die V.-nummer abfragen kann: Risc 2500, Milano, MM V usw. Aber auch da ist es mMn nicht sinnvoll, zu unterscheiden, solange es keine wirklich großen Differenzen gibt... viele Grüße, Robert |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
![]() Ich bin da nicht deiner Meinung; ich sehe nur 4 Abweichungen, die wirklich erwähnenswert sind. Differenzenen von 1-2 Sekunden sind für mich keine Abweichung, denn das sind normalerweise nur Messfehler!
Wenn man es genau nimmt, müsste jeder, der Partien zu unseren ELO-Listen beiträgt, alle seine Rechner durch den BT-Test jagen, um festzustellen, ob er vielleicht eine andere Version als die anderen hat! (schließlich muss der Operator ja seine Version angeben, damit man sie extra bewerten kann) Würden wir dies machen, hätten wir am Schluss vielleicht 10 verschiedene Atlanta/Magellan-Versionen, die sich aber nur marginal voneinander unterscheiden und pro Version vielleicht 10 Partien, die einfach zu wenig sind, um eine vernünftige ELO-Zahl zu berechnen. Selbst die Versionen, die Micha getestet hat und die du als unterschiedlich einstufst, haben praktisch identische Endergebnisse erzielt! Vergleiche doch mal, wie sehr sich zwei Rechner in den Einzelzeiten unterscheiden müssen, um wirklich deutlich unterschiedliche Endergebnisse zu erzielen. Und es kommt doch letztlich nur auf ein möglichst exaktes Endergebnis an, oder? Und selbst eine Differenz von +/- 50 ELO (was schon sehr viel wäre), kann durch die Varianz/Schwankungsbreite erklärt werden. Das bedeutet, selbst zwei absolut identische Klone können einmal 2000 und ein anderes mal 2100 ELO erzielen. Und um dies zu reduzieren, brauchen wir möglichst viele Partien, die wir (zumindest jetzt noch) nur durch Zusammenlegung bekommen. Und wie ich schon mehrfach schrieb: Es geht ja nicht nur um Unterschiede zwischen Atlanta und Magellan, sondern auch um Differenzen zwischen Atlanta und Atlanta bzw. Magellan und Magellan! Das müsste auch noch geklärt werden! Wo will man da anfangen? Wie Micha schon schrieb: Dadurch schafft man bei potentiellen Käufern dieser Rechner nur unnötige Verwirrung... Es gäbe da viel einfacher zu unterscheidende Rechner, bei denen wir sicher sind, dass es unterschiedliche Versionen gibt, weil man die V.-nummer abfragen kann: Risc 2500, Milano, MM V usw. Aber auch da ist es mMn nicht sinnvoll, zu unterscheiden, solange es keine wirklich großen Differenzen gibt... viele Grüße, Robert Hallo Robert; 1) Wenn du die 11 weg nimmst die beide nicht konnten dann hast du in der tatsache 10 von 29 abweichungen oder von mir aus 4 von 29 grosse abweichungen. 2) In der Aktiv liste sehe ich 439 spiele also mehr als genug um sie zu splitten und um zu sehen was da raus kommt oder? Reicht das nicht um zu sehen wo sie beide liegen? Wieviele spiele braucht wir 1000 ?? 3) Wenn es abweichungen gibt im software dann sehe ich das als noch ein groesseren Grund Magellan und Atlanta zu splitten. 4) Ich sage nicht das man Magellan 1 und Magellan 2 und Magellan 3 listet sondern nur das man Atlanta und Magellan mal seperat ueberprueft durch ihre eigene spiel ergebnisse. Was ist den so schlimm damit wenn sie gleiche ELO haben dann bleiben sie zusammen wenn nicht dann werden sie gesplittet? So zusammenfassung: 11 von 29 kleine abweichungen 4 von 29 grosse abweichungen 429 spiele in der Aktiv liste gebuendelt (reicht aus fuer beide um zu sehen wo sie in der tatsache beide liegen oder?) Klappt nicht mit brute test (has du robert schon gemacht mit 3 oder 4 abweichungen in 25 zuege) Klappt noch weniger in selective Active spiele/turnier spiele da gibt es hoehere abweichungen jedesmal. Was gibt es denn noch als pro fuer das bundeln Ach ja die grunde wieso nicht: 1) Hersteller sagt so ![]() 2) War schon immer so. ![]() Viele gruesse Nick Geändert von spacious_mind (22.01.2008 um 16:50 Uhr) |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
![]() 2) In der Aktiv liste sehe ich 439 spiele also mehr als genug um sie zu splitten und um zu sehen was da raus kommt oder? Reicht das nicht um zu sehen wo sie beide liegen? Wieviele spiele brauch man 1000 ??
Es ist ja nicht so, dass man sagen kann, ich brauche 200 Partien, dann ist es korrekt, sondern die Varianz wird einfach nur kleiner. Selbst mit 1000 Partien hat man vielleicht noch +/- 10 ELO (keine Ahnung, ob das realistisch ist ![]() Zitieren:
3) Wenn es abweichungen gibt im software dann sehe ich das als noch ein groesseren Grund Magellan und Atlanta zu splitten.
Zitieren:
4) Ich sage nicht das man Magellan 1 und Magellan 2 und Magellan 3 listet
Zitieren:
sondern nur das man Atlanta und Magellan mal seperat ueberprueft durch ihre einge spiel ergebnisse. Was ist den so schlimm damit wenn sie gleiche ELO haben dann bleiben sie zusammen wenn nicht dann werden sie gesplittet?
Selbst wenn der Atlanta in Wirklichkeit 10 ELO stärker sein sollte, ist es leicht möglich, dass der Magellan in der Liste 50 ELO mehr hat! Erst mit zunehmender Anzahl an Partien wird sich diese Fehlerrate verringern. Zitieren:
429 spiele in der Aktiv liste gebuendelt (reicht aus fuer beide um zu sehen wo sie in der tatsache beide liegen oder?)
Um einen Fehler zu beseitigen, baut man mMn einen viel größeren ein... Versteh mich recht: Ich wäre auch interessiert, zu erfahren, ob es messbare Unterschiede gibt, aber ich fürchte, das wird schwer bis unmöglich sein, das festzustellen! viele Grüße, Robert |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
![]() Wenn du die Engines-Freaks fragst, werden sie sagen: JA! (und manchen reicht auch das nicht)
Es ist ja nicht so, dass man sagen kann, ich brauche 200 Partien, dann ist es korrekt, sondern die Varianz wird einfach nur kleiner. Selbst mit 1000 Partien hat man vielleicht noch +/- 10 ELO (keine Ahnung, ob das realistisch ist ![]() aber man wird erst nach vielen hundert Partien feststellen können, welcher der beiden besser ist! (wenn überhaupt!) Zitieren:
aber genau das ist ja das Problem: vielleicht gibt es Atlanta 1.01, 1.02, 1.03 und auch Magellan 1.01, 1.02 und 1.03. Dann hätte es ja keinen Sinn, nur nach Atlanta und Magellan zu splitten, wenn es für beide gleiche Softwareversionen gibt! Das würde mich vor einer Trennung interessieren.
Zitieren:
Aber es ist ja klar, dass sie keine gleiche ELO haben werden, weil die Ergebnisse viel zu ungenau sind! Genau das ist ja das Problem...
Selbst wenn der Atlanta in Wirklichkeit 10 ELO stärker sein sollte, ist es leicht möglich, dass der Magellan in der Liste 50 ELO mehr hat! Erst mit zunehmender Anzahl an Partien wird sich diese Fehlerrate verringern. Meiner Meinung nach reicht das nicht, da die Varianz selbst mit 429 Partien noch bei +/- 27 ELO liegt. Um einen Fehler zu beseitigen, baut man mMn einen viel größeren ein... Zitieren:
Versteh mich recht: Ich wäre auch interessiert, zu erfahren, ob es messbare Unterschiede gibt, aber ich fürchte, das wird schwer bis unmöglich sein, das festzustellen!
Mach mal alle diese obigen tests mit den Cougar and erklaer mir mal wieso er sein recht fuer einen seperaten platzt auf die listen hat wenn er ein ganz genauer klon zu Cosmos/ETC/Centurion mit 95% (100% macht er auch) zug wiederhohlung jedes mal? Seine 16Mhz haben hier weniger einfluss als die realitaet in seine spiele. Da liegen Magellan und Atlanta meilen entfernt gegenueber. viele Grüße, Nick Geändert von spacious_mind (22.01.2008 um 17:48 Uhr) |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
auch wenn es ein sehr interessantes Thema ist habe ich eine Frage am Rande.
Gibt es vom Centurion ebenfalls unterschiedliche Versionen. Ich meine damit nicht dass er mit dem GK 2100 baugleich ist. |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
![]() Nein die engine freaks akzeptieren jedes software als anders 100% und buendeln garnichts. So erkennen sie auch die kleinste varianz. sehe doch die listen wo sie zb den King 3.23 (Chessmaster 10) mit viele variationen offiziell listen. Wir bundeln alles dadurch werden wir nie wissen ob bei magellan vielleicht die wichtigkeit der figuren anders konfiguriert ist gegenuer den Atlanta. (Stellungtest werden hier kaum was zeigen koennen) Sie fangen auch mit wenig spiele an und bauen es mit der Zeit auf.
![]() Zitieren:
Das ELO wer was hat ist nicht interessant. Das interessante ist das alle test bis jetzt von alle leute hier im Forum (Endspieltest, Stellungtest, mehere Klontests) anzeigen das sie das spiel Schach nicht gleich spielen. Das hat nichts mit der staerke zu tun sondern mit der nicht gleichheit.
Aber unterschiedliche Stile kann man nicht anhand der ELO-Zahl erkennen. In der SSDF-Liste liegt der etwas zurückhaltend spielende R30 2.5 deutlich vor dem 2.2; bei uns ist es genau andersrum (wobei die Differenzen bei uns marginal sind) Zitieren:
Mach mal alle diese obigen tests mit den Cougar and erklaer mir mal wieso er sein recht fuer einen seperaten platzt auf die listen hat wenn er ein ganz genauer klon zu Cosmos/ETC/Centurion mit 95% (100% macht er auch) zug wiederhohlung jedes mal? Seine 16Mhz haben hier weniger einfluss als die realitaet in seine spiele. Zitieren:
Da liegen Magellan und Atlanta meilen entfernt gegenueber.
![]() viele Grüße, Robert |
|
||||||||||||
AW: Klon Test Magellan - Atlanta
![]() aber die können auch innerhalb weniger Tage/Wochen hunderte von Partien spielen; bei uns ist das etwas schwieriger!
![]() Zitieren:
wenn du meinst, dass sie unterschiedliche Spielstile haben: da magst du recht haben (konnte ich bislang noch nicht feststellen, aber wahrscheinlich spiele ich viel zu schlecht, um das beurteilen zu können)
Zitieren:
Aber unterschiedliche Stile kann man nicht anhand der ELO-Zahl erkennen. In der SSDF-Liste liegt der etwas zurückhaltend spielende R30 2.5 deutlich vor dem 2.2; bei uns ist es genau andersrum (wobei die Differenzen bei uns marginal sind)
Zitieren:
nun ja, 60 % Geschwindigkeitsvorteil ist nicht eben wenig; das sollten erfahrungsgemäß ca. 40-45 Punkte ausmachen.
Sorry, aber das glaube ich eher nicht... ![]() ![]() Wie kann man hier sagen das der Cougar weniger klon ist als Magellan - Atlanta oder auch weniger Klon ist als die anderen klons er beweist keine spiel verbesserung es ist Null oder gilt hier ein zug des 5%igen abweichungen. Wenn ja dann bedeutet es das alle geraete das recht haben fuer seperate listung ? Fakt bleibt Fakt es gibt keinen Fakt ausser aussagen was fuer das bundeln von magellan und atlanta spricht. Zeig mir den obigen test fuer Magellan -Atlanta. viele Grüße, Nick |
|
|||||||||||
AW: Klon Test Magellan - Atlanta
alsoliebeleut,beimanchenpostingsmussichechtmehrmal slesen,bevorichdeninhaltmitkriegt.unddasnicht,weil esschlechtformuliertist,sondernweilgroßundkleinsch reibungsowiekommas-vermutlichauseffizienzgründen-ganzfehlen.meinermeinungnachgehörtesschonzumgutent on,leichtlesbaretextezuposten.odersteheichmitdiese rmeinungalleineda?dannwerdeicheswohlweiterakzeptie renmüssen.
hierhabeicheinfachalleleerzeichensowiegroßschreibu ngenweggelassen,weilessoschnellerzuschreibenging.d iekannmanjadochganzlockerselbsteinstreuen-findeich. willhierbeimbestenwillenkeinenunfriedenstiften.abe rdasmussteraus. nixfürungut. ![]() derchinese,deranderesgewohntist |
![]() |
Themen-Optionen | |
Ansicht | |
|
|
![]() |
||||
Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
Test: Colditz Test | 'hard | Partien und Turniere / Games and Tournaments | 27 | 08.12.2015 15:53 |
Test: pgn test | Sargon | Teststellungen und Elo Listen / Test positions and Elo lists | 14 | 06.11.2008 11:45 |
Test: Taktik-Test | Permanent Brain | Teststellungen und Elo Listen / Test positions and Elo lists | 1 | 17.03.2008 23:00 |
Test: BT-Test Saitek Cougar | Eckehard Kopp | Teststellungen und Elo Listen / Test positions and Elo lists | 0 | 17.03.2005 22:33 |
Test: BT-Test GK 2100 | Eckehard Kopp | Teststellungen und Elo Listen / Test positions and Elo lists | 8 | 04.10.2004 18:17 |