
Zitat von
Solwac
Ich weiß nicht, ob der Vergleich mit Fernschach hier so hilfreich ist. Die Suche von Stockfish ist selektiv und damit spekulativ. Im Dickicht vieler Bewertungen mit 0,00 ist Stockfish offenbar hart an der Grenze dessen was im Spiel gegen andere Computer noch hilfreich ist (siehe die vielen Remis gegen schwächere Gegner beim letzten TCEC), insgesamt aber gut aufgestellt. Einzelne Züge zu übersehen wie Lg5 gehört dazu, es können nicht alle Züge gefunden werden, für eine hohe Spielstärke müssen hier Kompromisse eingegangen werden. Solange Schachprogramme nicht so gut lernen können wie Menschen, solange werden solche Fehler teilweise auch im Detail wiederholt. In einem Match wie gegen AlphaZero mit sehr begrenzter Variation in der Eröffnung werden grundlegende Fehler im Spielaufbau dann auch ohne exakte Wiederholung der Zugfolge häufig gebracht und führen insgesamt zu einer erhöhten Verlustrate.
Naja, ich mach halt ein wenig Schleichwerbung fürs Fernschach, grins. Aber im Ernst. Der Vergleich sollte ja nur aufzeigen, wo die Ähnlichkeiten des neuronalen Netzes mit der Denkweise eines Fernschach- oder auch schlicht generell eines menschlichen Spielers liegt. Dass die Suche von Stockfish völlig anders läuft sollte jedem klar sein. Du sprichst aber hier einen sehr wichtigen Punkt an mit dem Satz "Im Dickicht vieler Bewertungen mit 0,00 ist Stockfish offenbar hart an der Grenze dessen was im Spiel gegen andere Computer noch hilfreich ist." Und das ist genau das, was ich schon einige Posts vorher gesagt habe. Inwieweit das Schachprogramm für uns Menschen überhaupt nützlich ist, ist den Programmierern zwischenzeitlich ziemlich egal geworden. Es geht nur noch um den Punkt "Ich bin in der CCRL, CEGT, IPON (und wie sie alle heissen mögen)-Liste 2 Punkte besser". Eine reine Prestigesache also ohne praktischen Wert. Mir als Mensch bringen teilweise andere (gegen Computer schlechtere) Programme weit mehr als Stockfish. Lässt man ihn als Analyseengine bei z.B. einer WM-Übertragung mitlaufen versteht man diese tiefen Berechnungen als Otto-Normaldoof sowieso nicht mehr und als Analyseengine im Fernschach muss man sie quasi mit der Nase draufstoßen wo die wirklich guten Züge zu finden sind (z.B. durch den schon genannten Multivariantenmodus wo in einem Partiebeispiel dann Lg5 durchaus gefunden wurde). Würde ich - ich bleibe mal beim Fernschachbeispiel - jetzt statt meines 4-Kern-AMD einen Server mit 42 Kernen einsetzen wie er bei den TCEC-Turnieren eingesetzt wird und ohne selber mitzudenken nur die Computerzüge ausführen, wären meine Ergebnisse im Fernschach kaum besser als sie es jetzt sind. Die für die Analyse benötigten Informationen über taktische Fallstricke in einer Stellung bekomme ich aber auch von Engines die z. B. 200 Ratingpunkte schlechter gelistet sind. Insofern hat sich der Nutzen eines Stockfish für den menschlichen Spieler eigentlich schon erledigt.
Zitieren:
Im Laufe der Entwicklung von Schachprogrammen hat die Suche immer wieder Paradigmenwechsel erlebt. Zu Beginn war die statische Selektivität vorn, Brute Force hatte einfach keine Suchtiefe. Mit steigender Rechenleistung kamen die Erfolge von Brute Force, mit dem Höhepunkt Deep Blue. Aber im Windschatten kamen bereits die Programme mit dynamischer Selektivität (wesentlich Nullmove). Diese dynamisch beeinflusste Suche bekam mit LMR einen weiteren Schub und ist bei den besten Programmen locker 400+ Elo-Punkte im direkten Vergleich wert.
Das ist sicher richtig. Das Zauberwort ist aber hier auch "im direkten Vergleich". Nach Deep Blue war der Vergleich Mensch-Computer sowieso schon gegessen und es ging letztlich nur noch darum in irgendwelchen Computervergleichen zu zeigen "Ich kanns noch ein wenig besser". Vielleicht bin ich ja etwas altmodisch aber für mich zählt trotzdem immer noch die Frage: "Soll ich mir Programm A oder B oder C zulegen. Wo liegt für mich der Nutzen?" Wenn ich natürlich nur auf dem heimischen Computer Turniere zwischen den Programmen abhalten will die letztlich sowieso nur die bereits bestehenden Elo-Listen bestätigen dann stellt sich die Frage natürlich nicht. Dann stellt sich allenfalls die Frage, ob ich mit meinem Leben nichts besseres anzufangen weiss...
Zitieren:
Inzwischen ist die Suche aber bereits dabei an die Grenze der 50-Züge-Regel zu stoßen, d.h. eine weitere Vertiefung bringt nicht mehr so viel und eine sinnvolle Verdichtung des Suchbaums könnte wieder mehr für die Spielstärke bringen. Dies könnte ein Grund für den Erfolg von neuronalen Netzen sein, sie selektieren nicht aufgrund statischen Wissens (was aufgrund handgestrickter und limitierter Bewertungsfunktionen Lücken hat) oder dynamischer Suche (was wie Nullmove und LMR bisher nur schwer mit Schachwissen angereichert werden konnte), sie erwerben durch den Lernvorgang sehr umfangreiches Wissen und können so bei kleinerem Suchbaum erfolgreich sein. In Verbindung mit der normalen Bewertungsfunktion werden Figuren bereits so gut positioniert, dass kaum noch taktische Fehler von der Suche übersehen werden.
Und da sind wie wieder beim Fernschachvergleich oder schlicht beim Nutzen für den Menschen an sich. Denn hier wird wirklich ein Nutzen erreicht. Weitere Verschlimmbesserungen in den bestehenden Suchroutinen führen vielleicht (noch) zu größerer taktischer Tiefe unter Beibehaltung bestehender Fehler in der Suche und damit zu 2 Elopünktchen mehr, aber damit hat es sich auch schon. Das Schach, was aber hier durch das neuronale Netz AlphaZero gezeigt wurde war einerseits einfach nur schön, andererseits aber für den Schachspieler auch lehrreich. Man konnte hier die Wirkungsweise der Figuren sehr gut sehen, aus den Zugzwangsituationen Lehren ziehen, etc. Kurz gesagt: Man hat beim Nachspielen wirklich die Chance gehabt zu verstehen, warum AlphaZero gewonnen hat. Wenn ich eine Partie Stockfish - Komodo aus dem TCEC-Turnier nachspiele, verstehe ich das noch lange nicht. Das sind dann teilweise taktische Finessen irgendwo im 40. Halbzug die man kaum mehr nachvollziehen kann. Teilweise werden sogar schon nach der Eröffnungsbehandlung zich Treffer in den Tablebases angezeigt. Da kommt man als Mensch nicht mehr mit und es ist auch sinnlos es auch nur versuchen zu wollen. Die Muster der positionellen Opfer, die AlphaZero hier gespielt hat, konnte man jedoch nachvollziehen. Und damit ergibt sich für mich der praktische Nutzen. Ich könnte 1000 Partien aus den TCEC-Turnieren nachspielen und würde daraus vermutlich als Mensch nicht halb soviel lernen wie aus den 10 veröffentlichten Partien dieses Wettkampfs.