Schachcomputer.info Community

Schachcomputer.info Community (https://www.schachcomputer.info/forum/index.php)
-   Die ganze Welt der Schachcomputer / World of chess computers (https://www.schachcomputer.info/forum/forumdisplay.php?f=2)
-   -   Frage: Mm5 nur 1575 ELO ?? (https://www.schachcomputer.info/forum/showthread.php?t=5483)

Chessguru 27.06.2017 18:43

Mm5 nur 1575 ELO ??
 
Hallo,

ich weiß, ich werde diese Frage bereuen. Aber die Diskussion kommt ja immer wieder auf. Momentan so nebenbei im CSS-Forum.

Allerdings sollten wir diese Thematik aus diesem Thread wohl auslagern, sondern wird Kurt sauer, da es hier um seine gespielten Partien geht. ;)

Zitieren:

Zitat von borromeus (Beitrag 67404)
Ich würde soweit gehen, bei den Computer-Elos pauschal mal 200 abzuziehen um eine Relation zu einem menschlichen Gegner zu finden.

Warum? Zweite ausführliche Frage: Warum gerade 200? Warum nicht 100 oder 124 oder 163 oder 236 oder oder oder? Die SSDF hat damals, um genau zu sein im Jahr 2000, 100 Punkte ausgewürfelt. Natürlich anhand von sehr ausgewählten Partien. Wir erinnern uns:

Thoralf Karlsson: "Unsere Hoffnung ist, dass die SSDF-Einstufung der Top-Programme jetzt besser mit der Elo-Rangliste übereinstimmt. Falls die bisherige Überbewertung durch einen "Spreiz-Effekt" verursacht wurde, ist es gut möglich, dass ältere und schwächere Ranglisten-Teilnehmer besser gegen Menschen spielen, als es durch ihre Einstufung in der SSDF-Rangliste zu erwarten ist. Wichtiger ist für uns aber, dass die Top-Programme eine möglichst korrekte Bewertung erfahren.

We used the following computers Tournament Performance Rating against humans for a attempt to calibrate the elo towards the human elo. The games were played between 1987 and 1991.In 2000 we thought that this list was obsolete. We then took 115 suitable games from Chris Carson's collection of Man vs Machine games and made a new calibration. We had to lower the list with 100 points."


Und rein zufällig ergab sich die exakte Zahl von 100 Punkten. Ja, muss ich zugeben, hört sich recht glaubwürdig an. :rolleyes: Aber auch mit 100 Punkten weniger wurden die neuen Zahlen akzeptiert.

All die Jahre war es die heilige Liste der Schachcomputerverrückten. Geeicht und erstellt anhand von Partien gegen Menschen. Im Jahr 2000 dann die Änderung um 100 Punkte. Warum genau 100? Egal, passt schon.

Aber die Zeiten ändern sich. Mittlerweile wird die SSDF Liste in den einschlägigen Engine-Foren nicht mehr ernsthaft akzeptiert, da obsolet. Man greift lieber zu den neuen, schnelllebigen Listen, die die Top-Engines im Elo Bereich von 3100-3600 (je nach Bedenkzeit) ansiedeln. Wohl gemerkt rein rechnerisch, denn eine empirische Grundlage für menschliche Elo-Zahlen fehlt allen diesen Listen. So gut diese Listen auch die Abstände oder Zugewinne von Engines ausweisen können, mit menschlichen Elo Zahlen haben diese Listen nichts zu tun. Es sind rein theoretische Zahlen. Sollte ich falsch liegen, bitte ich um Turniere mit menschlichen Gegnern, wo die Top Engines ihre Elo Zahlen unter Beweise stellen konnten. Warum also sollte diese Listen dann als beweisführend für menschliche Elo Zahlen gelten?

Und genau da liegt der große Unterschied zu der SSDF oder auch zu unseren Listen. Wobei, ich erwähne es immer wieder, die Schachcomputer.info Elo Listen (= Wiki Elo Liste) sind meine, rein privaten Listen. Nie extern von mir beworben, immer als meine private Spielerei tituliert. Geltungsbereich maximal für die Schachcomputer.info Seiten. Wer Spaß daran hat, schaut sie sich an, schmunzelnd vielleicht, bricht in lautes Lachen aus, nickt zustimmend oder zieht schulterzuckend weiter.

Der damalige Startwert basiert auf der SSDF Liste vor der Abwertung.

Aber natürlich sind all diese Elo Werte für Schachcomputer völlig falsch, das ist mir schon klar. Sie waren es immer und werden es immer sein. Diese Werte sind mindestens 100, vielleicht 200 oder sogar 350 Elo zu hoch. Die Begründungen warum alles Mist war und ist, sind vielfältig. Im CSS Forum wird gerade eine neue Behauptung aufgestellt. Auch sehr schön, wie ich finde.

Was mich bei der ganzen Betrachtung wundert ist folgendes. Warum in aller Welt versagen menschliche Spieler in diversen Turnieren immer wieder gegen die völlig zu hoch eingestuften Schachcomputer?

Schaue ich zu den regelmäßig ausgetragenen Turnieren von Luis (MECA - http://www.meca-web.es/torneos.htm) nach Spanien oder nach Holland, ich erinnere an die diversen Aegon Turniere, immer wieder haben wir es mit Schwächlingen aus der menschlichen Gattung "Schachspieler" zu tun. "Schwächlinge", die sich ihre Elo Zahlen anhand von Partien erspielt haben. Wie kann das sein? Fragen über Fragen... :rolleyes:

Gruß
Micha

borromeus 27.06.2017 19:05

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von MaximinusThrax (Beitrag 67410)
Na ja, die Schweden hatten ja schon kräftig Elopunkte abgezogen - bei den Brettcomputern zumindest.

Grüße
Otto

Lieber Otto!

Nun, ich sehe, dass ich gegen die Compis- obwohl ich wirklich kein AntiComputerSchach spiele- mit etwa 2100 performe.
Ich bin aber bestenfalls ein 1900er, mein ELO Zahl ist noch geringer, aber das ist eine andere Geschichte.

Also die 200 Elo schauen solide aus denke ich, aber: gerne stelle ich mich, und vielleicht auch ein paar andere, einem Wettkampf Mensch-Maschine.... Wolfgang2 wäre sicher auch dabei.....
Das wäre mal eine sehr spannende Sache!

borromeus 27.06.2017 19:19

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von Chessguru (Beitrag 67411)
Hallo,

ich weiß, ich werde diese Frage bereuen. Aber die Diskussion kommt ja immer wieder auf. Momentan so nebenbei im CSS-Forum.
Warum gerade 200?
Gruß
Micha

Servus Micha,

in keinster Weise will ich die Korrektheit der Computer-ELO's kritisieren oder hinterfragen, denn diese ELO entstehen in einem System Computer- Computer.

Würde man Affen Schach beibringen hätte da wohl auch irgend ein OberAff 2850ELO- der aber- relativ zu Menschen nur 700ELO hätte. Das ist eine Eigenschaft des ELO- Systems. Es misst keine absolute Stärke.
Siehe zB Wiki: Capablanca, ein wahrhafter Könner, im Nachinein hat er laut Wiki 2877 ELO gehabt- ich danke aber, dass er heute gegen einen 2600er keinen Fuss auf den Boden brächte.

Wenn man zwei unterschiedliche Welten der relativen Bewertung von "Stärken" vergeichen will, muss man diese "erden" also eine Relation zwischen diesen Systemen herstellen.

Und da ist meine Schätzung eben 200, egal ob jetzt real 176 oder 228.... das ist ein Gefühl, mehr nicht.

Und zur näheren Erläuterung: ich denke, dass die ELO Zahlen im Bereich 1600-1700 ziemlich gut passen, denn da stellt Mensch oft was ein was Computer sieht.
Bei ELO2100 ist das eben nicht mehr so, da ist der Plan schon was mächtiges, und den hat der Computer nicht. Verstehst Du was ich meine? Ein Compi mit ELO2200 (CompiELo) ist taktisch möglicherweise viel stärker als ein Compi mit ELO2000- darum seine 200 ELO mehr, für den Menschen wird das aber möglicherweise nicht ins Gewicht fallen, da spielen beide Computer strategisch gleich schlecht.

RetroComp 27.06.2017 21:16

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Hallo,

bei Turnieren zu Hause Mensch gegen Computer müßte man natürlich schon auf eine starke Ehrlichkeit bauen. Dabei steht einem jedoch die eigene Eitelkeit ein bisschen im Wege. Gewinnpartien stellt natürlich jeder gerne ein und lässt sich dafür auf die Schulter klopfen. Dagegen stellt man Verlustpartien natürlich nicht so gerne ein, erst recht nicht wenn man auch noch sehr "dumme" Fehler begangen hat und man dafür auch noch kritisiert wird. Die Verlockung einen schlechten Zug zurückzunehmen ist ja auch noch da.
Nicht das ich falsch verstanden werde, ich glaube schon das hier im Forum sehr viele sehr ehrlich wären, ich glaube aber trotzdem das bei einem öffentlichen Turnier mit Schiedsrichter das Ergebnis anders aussehen würde und zwar zugunsten der Computer.

Viele Grüße
Jürgen

Fluppio 27.06.2017 21:24

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Sehe ich ähnlich. Zu Hause im stillen Kämmerlein ist man keinem Druck ausgesetzt, in einem öffentlichen Wettkampf oder auch einem Mensch-Computer-Turnier wie früher AEGON, hat man immer Kiebitze um sich herum, eventuell Lautstärke etc. Da passiert schneller mal ein Lapsus und schon ist die Partie für den Menschen hin.

Chessguru 27.06.2017 22:07

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
1 Anhang/Anhänge
Hallo Karl,

Zitieren:

Zitat von borromeus (Beitrag 67413)
in keinster Weise will ich die Korrektheit der Computer-ELO's kritisieren oder hinterfragen, denn diese ELO entstehen in einem System Computer- Computer.

naja doch, irgendwie schon. Worauf bezieht sich deine Kritik denn?

Zitieren:

Würde man Affen Schach beibringen hätte da wohl auch irgend ein OberAff 2850ELO- der aber- relativ zu Menschen nur 700ELO hätte. Das ist eine Eigenschaft des ELO- Systems. Es misst keine absolute Stärke.
Der Vergleich ist im Grundsatz richtig, nur basiert die SSDF Liste nicht auf reinen Computerpartien, wie z.B. bei den reinen Engine Listen. Die Grundlagen bildeten Partien gegen Menschen.

1992 veröffentlichte die CSS (Heft 1 / Feb.-März 1992 / Seite 26ff) eine Schachcomputer (+ Großrechner) Rangliste von Werner Stowasser. Diese basierte auf 4618 Partien gegen Menschen und 29617 reinen Computerpartien. Für heutige Verhältnisse keine überragende Datenbasis, aber zumindest eine gute Basis für eine Auswertung die auf Fakten beruhte.

https://www.schachcomputer.info/foru...achmentid=3299

Zitieren:

Wenn man zwei unterschiedliche Welten der relativen Bewertung von "Stärken" vergeichen will, muss man diese "erden" also eine Relation zwischen diesen Systemen herstellen.

Und da ist meine Schätzung eben 200, egal ob jetzt real 176 oder 228.... das ist ein Gefühl, mehr nicht.
Siehst du und hier liegt das Problem. Eine korrekte Elo Liste (also nach menschlichem Maßstab, denn dafür war die Elo Zahl ja gedacht) für Computer kann es eigentlich nicht geben. Zu verschieden sind die Faktoren, wenn ein Mensch eine Partie gegen einen Computer spielt. Und auch deine Argumentation basiert auf einem Gefühl. Nach deinem Gefühl sind die Zahlen 200 Elo zu hoch, SSDF bietet 100, andere "fühlen" 350 oder was weiß ich. Mit welchen Gefühlen stimmt denn da etwas nicht? So wird die Sache nicht funktionieren. Wenn man dann noch die Art der Berechnung der verschiedenen Programme zur Spielstärkeberechnung kennt, macht es die Sache auch nicht leichter.

Meine Sicht: Schaut euch die Abstände der Geräte untereinander an und seht unsere Listen maximal als Anhaltspunkt. Aber mit Argumenten wie momentan im CSS Forum geäußert, kann ich nichts anfangen.

Aber ich bin immer an neuen Listen für Schachcomputer interessiert. Wer andere Listen vorlegen kann, die auf ausreichenden menschlichen Vergleichen beruht, immer her damit.

Gruß
Micha

MaximinusThrax 27.06.2017 22:59

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Genau so sieht es nämlich aus!

Fast bin ich versucht abzulästern: jeder möge sich seine eigene Liste rahmen und sich über's Bettchen hängen, wenns schee macht....:p und beim Einschlafen hilft...
Da ich aber nie nieee Gehässig bin läster ich auch nicht...:rolleyes: :D


In diesem Sinne,
auf die Richtige Liste
und schlaft schön!

Otto

Wolfgang2 27.06.2017 23:50

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von borromeus (Beitrag 67413)
...
Bei ELO2100 ist das eben nicht mehr so, da ist der Plan schon was mächtiges, und den hat der Computer nicht. Verstehst Du was ich meine? Ein Compi mit ELO2200 (CompiELo) ist taktisch möglicherweise viel stärker als ein Compi mit ELO2000- darum seine 200 ELO mehr, für den Menschen wird das aber möglicherweise nicht ins Gewicht fallen, da spielen beide Computer strategisch gleich schlecht.

Genau so sieht es aus. Besonders den zweiten Teil der Aussage möchte ich absolut unterstreichen. Wenn man ein paar Grundprinzipien hat, z.B.:
(a) Früher Damentausch,
(b) antizyklische (d.h. heterogene) oder gar keine Rochade;
(c) Verzahnung von Bauernstrukturen, falls die Vereinfachung nicht gelingt,
(d) Locken des Computers zu verfrühten Bauernzügen,
(e) Bildung von Bauernmajoritäten auf dem Flügel, wo der eigene König steht
(f) Vermeidung von Komplikationen
(g) Schaffung starker Doppelbauern, was Computer falsch einschätzen
(h) Belagerung gegnerischer Isolanis
(i) Anstreben eines Turmendspiels, mit der Option auf ein gewonnenes Bauernendspiel
(j) Schaffung entfernter Freibauern, insbesondere Randbauern!, die tendenziell unterbewertet werden.

.... dann kommt man ohne allzu großes Kopfzerbrechen gegen viele Brettcomputer in ausgeglichene Partien, die man am Ende noch gewinnt.

Allerdings wird an dem Punkt dann tatsächlich sichtbar, wer das, was ich oben beschrieben habe, mit sich machen lässt (praktisch alle meine Brettcomputer) - und wer nicht. Da ist Hiarcs (obwohl ich nur die Version 12 habe) nach meinem Eindruck den "Brettis" deutlich voraus.

Gruß
Wolfgang

borromeus 28.06.2017 00:21

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von Chessguru (Beitrag 67419)
Hallo Karl,

naja doch, irgendwie schon. Worauf bezieht sich deine Kritik denn?

Gruß
Micha

Lieber Micha,

ehrlich gesagt verstehe ich nicht was Du hier sagst, denn ich habe keine Kritik geübt, sondern nur geschrieben, dass die Compi-ELO Liste im Vergleich zu Menschen aus meiner Sicht um 200 ELO's zu hoch ist, speziell im Bereich ab etwa ELO 1900/2000.

Das ist, wie ich schon schrieb, vermutlich ein Effekt der taktischen Fähigkeiten/Unfähigkeiten der Compis, die DEREN Differenz ergeben.

Ich weiss nicht, ob Du selber Turnierschach/Meisterschaft spielst- aber ein ELO2000 Mensch spielt weitaus unangenehmer als ein Novag Diablo.
Ein Kurt (19xx) putzt in einer Partie einen R30 weg, ein Wolfgang zerlegt die Geräte laufend (auch wenn wir seine Verlustpartien (möglicherweise gibt es diese ja nicht) nicht sehen)- aber er hat laut eigenen Angaben etwa 1800, und ich aktuell 1762, performe mit 2100.

Was wäre wohl hier der korrekte Schluss? Lediglich, dass die ELO- Zahlen der Compis wohl zu hoch liegen.

Also, bei allem Respekt, es wurde hier keine Kritik geübt- woran auch? Die Daten der Compis liegen ja vor und daraus ergibt sich unter einer Basisvoraussetzung eben eine ELO Zahl. Das heisst aber nicht, dass diese auf Menschen bezogen stimmen, bzw. nur weil diese irgendwann vor 25 Jahren mit "wenigen" Partien mitgeeicht wurden, heute eine reale Aussage darstellen.

So long, in keiner Weise wollte ich was kritisieren, sry wenn Du das so aufgenommen hast, aber eine Meinung wird ja erlaubt sein.

Gruß
Karl

Wolfgang2 28.06.2017 00:42

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von borromeus (Beitrag 67428)
....Ein Kurt (19xx) putzt in einer Partie einen R30 weg, ein Wolfgang zerlegt die Geräte laufend (auch wenn wir seine Verlustpartien (möglicherweise gibt es diese ja nicht) nicht sehen)- aber er hat laut eigenen Angaben etwa 1800, und ich aktuell 1762, performe mit 2100.
...

Hallo Karl,
"um Elo 1800" war mal eine Schätzung von drei Elo 1900-2000 Spielern gegen die ich einige Aktivpartien spielte. Das ist aber um die 20-25 Jahre her. Im Blitzspiel bin ich deutlich schwächer, auch gegen Computer. Vielleicht Elo 1500, ich weiß es nicht.
Ich möchte auch nicht sagen, dass ich die Geräte "zerlege" (trotzdem Danke für das Lob ;) ). Was ich hier zeige, ist eher, dass es eine Menge von Schwachpunkten gibt, die man ausnutzen kann.

Gruß
Wolfgang

Hartmut 28.06.2017 02:46

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von borromeus (Beitrag 67404)
Interessant wäre doch mal ein OnlineTurnier Computer gegen Menschen- Fairness vorausgesetzt bekäme man da nach einigen zig- Partien einen brauchbaren Maßstab.

Bei so einem Turnier wäre ich sofort dabei zumal sich meine eigene Schachcomputer-Sammlung in überschaubaren Größen bewegt und nur durch die MESS-Emu aufgemotzt wird, wäre es für mich interessant mal gegen andere Geräte anzutreten. Vor allem die, welche noch nicht als Emulation verfügbar sind.

Solwac 28.06.2017 09:20

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Die Sache mit der Eloliste ist leider nicht so einfach wie sie in der CSS immer mal wieder dargestellt wurde.

Als die Spitzengeräte ungefähr bei 1800 lagen, da gab es reichlich Partien gegen Menschen zum Vergleich. Bei den Menschen waren viele, die keine Erfahrung mit Computern hatten und Partien unter Wert verloren haben. Sei es wegen einer Überschätzung der Endspielfähigkeiten, sei es wegen ungewohnter Stellungsbilder.

Bei 2000 wurden immer noch viele Partien gegen Menschen gespielt und die Erfahrung war immer noch gering. Computer wurden zwar nicht mehr ganz so unterschätzt, aber viele Vereinsspieler spielten wie gegen Menschen und verloren mehr als "nötig". Gerade in den USA begann die USCF ein unrühmliches Kapitel über Schachcomputer in Turnieren.

In den Jahren bis 2200 erreicht waren, entstanden letztmalig viele gewertete Partien gegen Menschen. Teilweise (Fidelity) mit unsauberen Methoden, teilweise mit einer sehr großen Streuung (Novag). Bei Mephisto wurde sehr viel Wert auf die Spitzengeräte gelegt, aber bei aller Qualität, die Ergebnisse gegen Computer waren für die Werbung viel besser zu verwerten.

War der Amsterdam einfach nur stärker als die Konkurrenz, so kam danach auch immer noch die Hardware hinzu. Gegen die 68020 hatten auch mit 6 MHz getaktete 6502 keine Chance mehr. Die Ergebnisse der besten Computer gegen das Mittelfeld waren so gut, dass die errechnete Elo stark stieg. Im Spiel gegen Menschen war aber eher die Software entscheidend, denn die Menschen konnten verbesserte Taktik noch positionell kontern. Spitzenprogramme waren gegenüber gut informierten Menschen überbewertet, nur gegen nominell starke Menschen ohne Computererfahrung gelangen überdurchschnittliche Ratings.

Zum Zeitpunkt der Abstufung um 100 Elopunkte durch die SSDF wurde Spitzenprogramme durch ihre Erfolge gegen andere Computer zu hoch eingestuft und die älteren und schwächeren Programme rückten mehr und mehr in den Hintergrund. Die Abstufung um genau 100 Punkte war willkürlich, denn rein mathematisch über alle Programme war ja alles richtig gerechnet. Nur überzeichnen Computer gegeneinander ihre Spielstärkeunterschiede. Bei 100 Elo Differenz (ermittelt z.B. aus dem Vergleich mit Menschen) werden mehr als 64% der Punkte erzielt. Das Elo-Modell passt einfach nicht mehr.

Beim Menschen fallen Unzulänglichkeiten im Elo-Modell naturgemäß weniger auf. Zum einen verändern sich die Zahlen über die Zeit und eine Formschwankung von 50 Elopunkten wird nicht absolut verglichen sondern mit anderen Spielern ähnlichen Niveaus. Zum anderen reicht die Partiezahl nur für eine relativ bescheidene mathematische Genauigkeit. Es ist spannender die kleinen Sprünge auf Chess 2700 zu verfolgen als tatsächliche Erwartungen statistisch zu verfolgen.

Was bedeutet das für Spieler um die Elo 2000 und Partien gegen Computer? Das Wissen um die Spielweise kann sehr helfen (und dann bekommen Programme mit nominell 2200 eines auf die Mütze) aber Konzentration, Detailkenntnisse über das Eröffnungsbuch oder einzelne Bewertungskomponenten eines Programmes und äußere Umstände beeinflussen das Ergebnisse deutlich. Gerade die Erfahrung ist hier für Menschen sehr hilfreich. Ich bin mir sicher, auch ohne Schummelei oder ähnliches, die Ergebnisse eines Spielers gegen Computer fallen ein gutes Stück schlechter aus wenn das Programm anonym bleiben würde.

Robert 28.06.2017 09:21

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Hallo zusammen,

Zitieren:

Zitat von borromeus (Beitrag 67428)
Was wäre wohl hier der korrekte Schluss? Lediglich, dass die ELO- Zahlen der Compis wohl zu hoch liegen.

Ich sehe das Problem unter anderem darin, dass man als Schachspieler den Begriff "ELO" mit Wertungszahlen von Menschen gleichstellt. Und jemand, der mit Computerschach nicht soviel am Hut hat, vergleicht unsere Zahlen unwillkürlich mit "menschlichen" ELO; doch das klappt natürlich nicht, weil unsere Liste nicht mit Computer vs Mensch-Partien geeicht ist (oder zumindest mit viel zu wenigen)

Eigentlich müssten wir eine eigene Bezeichnung verwenden, wie es ja z. B. der Deutsche Schachbund mit DWZ und sein US-Amerikanisches Pendant mit seinem USCF-Rating machen.

Also z. B. sowas wie "SCIR" (SchachComputer.Info-Rating)

Dann hätte sich diese ganze Diskussion erledigt und es sollte dann klar sein, dass unsere Listen mit menschlichen ELOs wenig bis nichts zu tun haben.

Und jetzt sollten wir hier den Platz wieder für Kurt und seine Partien freimachen ;) (und die Diskussion auslagern, wenn es noch weitergehen sollte)

viele Grüße
Robert

Chessguru 28.06.2017 11:38

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Hallo Robert,

Zitieren:

Zitat von Robert (Beitrag 67434)
Ich sehe das Problem unter anderem darin, dass man als Schachspieler den Begriff "ELO" mit Wertungszahlen von Menschen gleichstellt. Und jemand, der mit Computerschach nicht soviel am Hut hat, vergleicht unsere Zahlen unwillkürlich mit "menschlichen" ELO; doch das klappt natürlich nicht, weil unsere Liste nicht mit Computer vs Mensch-Partien geeicht ist (oder zumindest mit viel zu wenigen)

das Problem an der Sache, Schachcomputer wurden ja für das Spiel gegen Menschen gebaut. Somit wird der Fokus eines Käufers, Spieler etc. immer auch auf die Spielstärke gerichtet sein. Ob es nun ein Schachcomputer oder Schachprogramm ist, sei erst einmal dahingestellt. Fakt ist, die erste Frage lautet fast immer': Wie stark ist das Gerät/Programm = wie viele Elos kann das Teil auf die Waage bringen? Und schon landest du wie bei dem angesprochenen Problem. Man wird immer Vergleiche zur menschlichen Spielstärkebeschreibung suchen. Alles andere macht auch keinen Sinn.

Schon vor Jahren habe ich Diskussionen wegen dieser sch... Listen geführt. Beispiel: "Ich habe gegen Gerät XY immer so um die 50% geholt und damals hatte ich 1800 Elo. Also MUSS dieses Gerät in der Liste auch 1800 Elo haben... Du musst das sofort ändern." Es war und wird immer das Gleiche sein. :dead: Lustig an der Sache, irgendwie scheint kaum mal jemand gegen ein Gerät zu verlieren. Womit wir wieder bei dem Thema "stilles Kämmerlein" wären.

Zitieren:

Also z. B. sowas wie "SCIR" (SchachComputer.Info-Rating)
Ja, aber was bringt dir das? Die Gegenfrage wäre dann bestimmt, kann man das in Elo umrechnen? ;)

Mittlerweile sehe ich solche Diskussionen mit einer gewissen Gelassenheit. Die Diskussionen verlaufen eigentlich immer nach dem gleichen emotionalen Prinzip. Man zieht Rückschlüsse aufgrund des eigenen Spiels gegen Geräte/Programme..., weil die eigene Elo Zahl oder die man meint zu haben, als Faktum erst einmal steht. Und genau aufgrund dieser eigenen Erfahrungen, sollten entsprechende Elo Listen dann auch aussehen. Problem an der Sache, jeder hat seine eigenen Erfahrungen gesammelt und würde immer darauf pochen, das genau er aber völlig richtig liegt mit seiner Einschätzung. Womit wir wieder bei den 100, 200 usw. Punkten Problematik anfangen. Ich könnte nun Partien vorlegen, wo 2200/2300 Elo Spieler gegen starke Geräte verloren haben. Würde aber an dem Standpunkt nichts ändern. Ein Standpunkt sollte aber nicht nur das sein, worauf man ständig stehen bleibt.

Was ich mit meinem ganzen Gequatsche in den Postings zuvor ausdrücken wollte, ist eigentlich recht simpel. Aus meiner Sicht wird viel zu sehr auf dem eigenen Standpunkt beharrt. Man möchte nicht mit anderen Fakten belästigt werden, da die eigene Meinung ja völlig korrekt ist. Zumindest aus der eigenen Sicht... ;)

Warum nur sieht man die Sache so verkrampft? Persönlich ist es mir völlig egal, ob unsere Listen nun bei 2400, 2200 oder 2000 oder wo auch immer beginnen, denn allen kann man es nie Recht machen. Aber nur den Blick ausschließlich auf die eigenen Erfahrungen zu richten und keine anderen Fakten zu akzeptieren, ist mir dann doch etwas zu einfach gedacht.

Nochmal zu den info Listen. Gründe für die Erstellung der Listen waren für mich (oder uns damals) auch fragwürdige Aktionen seitens der SSDF wie z.B. Stichwort Mephisto MM IV Turbo. Aber auch die Einschätzungen einiger Geräte, die nicht aus dem Hause Mephisto stammten, waren für mich immer etwas seltsam. Auch der seltsame Zuwachs von immer so um die 20 Elos bei neuen Mephisto Geräten oder die anfangs zu hohe Einordnung von Neuerscheinungen.

Mein Ansatz war einfach. Ich wollte eine kostenlose Liste, die nur auf Partien beruht, die von freien Testern gespielt wurden. Keine Beeinflussung von Firmen, Herstellern etc. und ich wollte somit eine Vergleichbarkeit zu den alten SSDF Listen erstellen. Ob nun mit 100 Elo mehr oder weniger, who cares?

Bei aller berechtigten und unberechtigten Kritik (oder Äußerungen, bevor sich jemand angegriffen fühlt...) an den Werten, habe ich 2 abschließende Fragen.

1. Ist es sinnvoll Listen zu erstellen?
2. Wenn ja, wie sollte diese dann aussehen und auf welchen Fakten beruhen?

Vielleicht könnte jemand eine Liste einstellen, die nach eurer Meinung Elo Werte korrekt wiedergibt.

Gruß
Micha

Wolfgang2 28.06.2017 12:05

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Hallo Micha,

meine Meinung zu dem Thema ist ja auch bekannt.... ;)
Dennoch: Meinetwegen soll alles so bleiben, wie es ist. Wer sich einen neuen, mit 2300 bis 2400 Elo taxierten Holzcomputer kauft - und hinterher enttäuscht ist, ist selbst schuld. Das gilt heute noch mehr als vor 25 bis 30 Jahren, als es noch nicht für Jedermann die Informationsquellen von heute gab.

Gruß
Wolfgang

mclane 28.06.2017 12:38

Mm5 nur 1575 ELO ??
 
Im CSS Forum wird im Moment gemunkelt alle unsere Schachcomputer
Elo Werte seien 300 Elo zu hoch geschätzt.

Man bezieht sich wohl auf vergleiche der ssdf mit heutigen Elo listen.

Nur: damals wurden noch regelmäßig Abgleiche mit menschlichen Elo durch
Turniere erspielt.

Heute spielen die Programme nur noch automatisiert gegeneinander.

Da würde ich mal eher die Vermutung äußern das mangels Abgleich die heutigen zahlen "falsch" sind.
Damals gab es ständig Abgleiche. Porzer Open, Aegon Turnier, in schachvereinen, in Wohnzimmern bei Privatleuten zuhause.

Da wäre doch schon aufgefallen das ein Gerät 300 elo schwächer ist .... oder ?

RetroComp 28.06.2017 13:42

AW: Mm5 nur 1575 ELO ??
 
Hallo Thorsten,

Du hast die Antwort auf Deine Frage im Titel ja schon selbst im Text gegeben.
Ich lese gerade einige Modulhefte von 1991. Wenn man sieht mit welchem Enthusiasmus man die damaligen Schachcomputer unter die Lupe nahm, testete und Turniere ausführte, hatten diese Geräte schon eine ordentlich Spielstärke. Begeisterte Vereinsschachspieler hätten sich wohl nicht so lange mit den Modellen, wie Polgar, Milano, MMIV, MMV beschäftigt wenn sie "nur" 1575 ELO gehabt hätten. Ich vermute genau wie Du, gerade die Elozahlen der damaligen Geräte um die 1800~2100 ELo wurden doch ohne Ende getestet und diese Werte sind recht solide mit aktiven Schachspielern unter Turnierbedingungen abgeglichen worden.

Beste Grüße
Jürgen

Solwac 28.06.2017 13:55

AW: Tasc R30 - Utzinger,K (01), Rapid 60'
 
Zitieren:

Zitat von Chessguru (Beitrag 67439)
Beispiel: "Ich habe gegen Gerät XY immer so um die 50% geholt und damals hatte ich 1800 Elo. Also MUSS dieses Gerät in der Liste auch 1800 Elo haben... Du musst das sofort ändern."

Ich bin mir sicher, mit richtiger Unsicherheitsbetrachtung sind alle echten Zahlen kompatibel und zurecht geschusterte fallen auf.
Aber wahrscheinlich würde keiner mit 1823 Elo es akzeptieren, wenn von 1823 +177 -186 geredet wird. Denn die Elozahl kommt ja mit nur kleineren Schwankungen vom Schachverband... ;)

mclane 28.06.2017 14:00

AW: Mm5 nur 1575 ELO ??
 
Nehmen wir mal superconny, ich erinnere mich das der viel in den schachvereinen eingesetzt wurde zum Amüsement.
Zu seiner Zeit war er ja verhältnismäßig stark, verglichen mit dem was sonst so käuflich da war. Das erste mal eigentlich das ein Schachcomputer , zudem noch mit Kaffeehausspiel, kleine Erfolge erringen konnte.

1995 hatte der 1731 elo.

Dann hätte das Gerät nur 1431 elo ??

Wir haben damals auf jeden Fall ständig Schachcomputer gegen Menschen spielen lassen, nicht nur untereinander. Und dann versucht die Ergebnisse miteinander zu vergleichen und in Einklang zu bringen. Damals konnten die Menschen die Computer noch schlagen, erst recht starke Vereinsspieler oder IMs oder GMs . Beim Porzer Open erzielten die Geräte Wertungen. Leute kauften sich Schachcomputer und spielten zuhause damit. Wenn die Gerät 300 elo schwächer gewesen wären, hätte es manchmal dazu führen müssen das die Menschen dann diese Geräte überwiegend schlagen.

Solwac 28.06.2017 14:20

AW: Mm5 nur 1575 ELO ??
 
Die Zahl der selbsternannten Experten im CSS Forum ist wahrscheinlich ähnlich übertrieben wie die Listen aktueller Programme aufgrund von Autoplay. ;)
Frank Quisinsky ist sehr engagiert, aber leider hat er in all den Jahren immer wieder gewisse grundlegende Dinge nicht verstanden und versucht dagegen an zu reden.
Das Problem ist wie die Verwendung von Zoll-Profilen bei einem Gerüst mit 2,5 cm Raster. Ich kann vorne die Langlöcher in Übereinstimmung bringen oder hinten, aber nicht überall.

RetroComp 28.06.2017 15:01

AW: Mm5 nur 1575 ELO ??
 
Es gibt ja auch noch verschiedene Stellungstest, wie z.B. den BT test die ja auch einen Anhaltspunkt zur Spielstärke liefern.

Egbert 28.06.2017 16:41

AW: Tasc R30 - Utzinger, Rapid 60'
 
Hallo Micha,

ich sehe keine Veranlassung unsere Schachcomputer Elo Listen, sei es Aktiv- oder Turnierschach, zu ändern. Zu Recht hast Du bemerkt, dass es hierzu immer einmal wieder umfangreiche Diskussionen zu dem Thema gibt. Basis für unsere Listen waren die ursprünglichen Werte aus der SSDF-Liste, welche ja seinerzeit umfangreich gegen Menschen mit unterschiedliche Elo-Zahlen geeicht wurden. Ich sehe weit und breit keine Elo-Listen die diesbezüglich mehr Aussagekraft besäßen.

Klar jeder hat gewisse Empfindungen, meine ist z.B. dass wir bei den stärkeren Schachcomputern vielleicht tatsächlich ein Stück zu hoch liegen, aber dieses "Gefühl" oder die Empfindung hat absolut null Aussagekraft. Ich kann mit unseren Listen sehr gut leben. :)

Gruß
Egbert

Chessguru 28.06.2017 16:51

AW: Mm5 nur 1575 ELO ??
 
Hallo Egbert,

danke.

Ich habe die Frage ja nicht umsonst gestellt. Warum erstelle ich diese Listen noch immer? Für mich? Wohl kaum. Die Nummer könnte ich auch viel einfacher und mit deutlich weniger Aufwand betreiben.

Die Listen erstelle ich hauptsächlich nur noch für unsere Community. Sollte also die Mehrheit der Community z.B. eine Angleichung an die SSDF wünschen, wäre es ein leichtes die Listen anzupassen. Daher die Nachfrage.

Für mich kommen eigentlich nur 2 Varianten in Frage.

Variante 1: Startwert der alten SSDF Liste vor der Abwertung
Variante 2: Startwert der neuen SSDF nach der Abwertung

Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen.

Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten.

Gruß
Micha

Egbert 28.06.2017 16:58

AW: Mm5 nur 1575 ELO ??
 
Zitieren:

Zitat von Chessguru (Beitrag 67457)
Hallo Egbert,

danke.

Ich habe die Frage ja nicht umsonst gestellt. Warum erstelle ich diese Listen noch immer? Für mich? Wohl kaum. Die Nummer könnte ich auch viel einfacher und mit deutlich weniger Aufwand betreiben.

Die Listen erstelle ich hauptsächlich nur noch für unsere Community. Sollte also die Mehrheit der Community z.B. eine Angleichung an die SSDF wünschen, wäre es ein leichtes die Listen anzupassen. Daher die Nachfrage.

Für mich kommen eigentlich nur 2 Varianten in Frage.

Variante 1: Startwert der alten SSDF Liste vor der Abwertung
Variante 2: Startwert der neuen SSDF nach der Abwertung

Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen.

Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten.

Gruß
Micha

Hallo Micha, ich bin nach wie vor für die aktuelle Variante 1. Klar habe ich das "Gefühl" dass die starken Schachcomputer etwas zu hoch liegen, aber bei Variante 2 wären viele schwächere Geräte aus meiner Sicht unterbewertet.

Gruß
Egbert

borromeus 28.06.2017 17:02

AW: Mm5 nur 1575 ELO ??
 
Zitieren:

Zitat von Chessguru (Beitrag 67457)
Für mich kommen eigentlich nur 2 Varianten in Frage.

Variante 1: Startwert der alten SSDF Liste vor der Abwertung
Variante 2: Startwert der neuen SSDF nach der Abwertung

Schließlich handelt es sich hauptsächlich um Partien von Mitgliedern aus dieser Community. Daher versuche ich eine Mehrheit zu ergründen. Ist aber immer etwas schwierig, da wenig Feedback kommt. Kritik ist immer willkommen, nur ich möchte dann aber auch Lösungsvorschläge lesen, die uns in der Angelegenheit weiterbringen.

Diese sollten aber von Schachspielern stammen und nicht von Statistikern, die sich für Schachspieler halten.

Gruß
Micha

Wie kann man den Startwert definieren? Mag es eine Wissenlücke sein, Entschuldigung, aber ich weiss das definitiv nicht.

Kann man ein paar Geräte als Referenz angeben?
Ist es daher möglich mit zB 10 Geräten und zB 100 Partien Menschen - Computer diese 10 Geräte als Referenz der Berechnung zu definieren?

Gruß
Karl


Alle Zeitangaben in WEZ +2. Es ist jetzt 11:06 Uhr.

Powered by vBulletin (Deutsch)
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
©Schachcomputer.info