Einzelnen Beitrag anzeigen
  #101  
Alt 21.12.2017, 13:33
Benutzerbild von spacious_mind
spacious_mind spacious_mind ist offline
Lebende Foren Legende
 
Registriert seit: 29.06.2006
Ort: Alabama, USA
Land:
Beiträge: 2.001
Abgegebene Danke: 126
Erhielt 508 Danke für 265 Beiträge
Aktivitäten Langlebigkeit
13/20 18/20
Heute Beiträge
2/3 sssss2001
Re: AW: Selbstlernende KI: Neue Engine spielt auf Profi-Niveau

 Zitat von Solwac Beitrag anzeigen
Ich weiß nicht, ob der Vergleich mit Fernschach hier so hilfreich ist. Die Suche von Stockfish ist selektiv und damit spekulativ. Im Dickicht vieler Bewertungen mit 0,00 ist Stockfish offenbar hart an der Grenze dessen was im Spiel gegen andere Computer noch hilfreich ist (siehe die vielen Remis gegen schwächere Gegner beim letzten TCEC), insgesamt aber gut aufgestellt. Einzelne Züge zu übersehen wie Lg5 gehört dazu, es können nicht alle Züge gefunden werden, für eine hohe Spielstärke müssen hier Kompromisse eingegangen werden. Solange Schachprogramme nicht so gut lernen können wie Menschen, solange werden solche Fehler teilweise auch im Detail wiederholt. In einem Match wie gegen AlphaZero mit sehr begrenzter Variation in der Eröffnung werden grundlegende Fehler im Spielaufbau dann auch ohne exakte Wiederholung der Zugfolge häufig gebracht und führen insgesamt zu einer erhöhten Verlustrate.

Im Laufe der Entwicklung von Schachprogrammen hat die Suche immer wieder Paradigmenwechsel erlebt. Zu Beginn war die statische Selektivität vorn, Brute Force hatte einfach keine Suchtiefe. Mit steigender Rechenleistung kamen die Erfolge von Brute Force, mit dem Höhepunkt Deep Blue. Aber im Windschatten kamen bereits die Programme mit dynamischer Selektivität (wesentlich Nullmove). Diese dynamisch beeinflusste Suche bekam mit LMR einen weiteren Schub und ist bei den besten Programmen locker 400+ Elo-Punkte im direkten Vergleich wert.

Inzwischen ist die Suche aber bereits dabei an die Grenze der 50-Züge-Regel zu stoßen, d.h. eine weitere Vertiefung bringt nicht mehr so viel und eine sinnvolle Verdichtung des Suchbaums könnte wieder mehr für die Spielstärke bringen. Dies könnte ein Grund für den Erfolg von neuronalen Netzen sein, sie selektieren nicht aufgrund statischen Wissens (was aufgrund handgestrickter und limitierter Bewertungsfunktionen Lücken hat) oder dynamischer Suche (was wie Nullmove und LMR bisher nur schwer mit Schachwissen angereichert werden konnte), sie erwerben durch den Lernvorgang sehr umfangreiches Wissen und können so bei kleinerem Suchbaum erfolgreich sein. In Verbindung mit der normalen Bewertungsfunktion werden Figuren bereits so gut positioniert, dass kaum noch taktische Fehler von der Suche übersehen werden.

Was ich eigentlich sage als Skeptischer Mensch bis information wrklich auftaucht das SF gegen 1000 SF's spielt. Meinst du wirklich sie haben Ihren eigenes Schachprogram geschrieben wen Sf GPL ist?

Dafuer sehe ich den Zug Rxc5 als guter Beispiel. 3 Zuege spaeter spielt der wirkliche SF Rf8? mit -8.18 weil er cache probleme hat. Das interessante ist das es schwer zu beweisen ist das Rxc5 tatsachlich der bester zug war weil es bei der Stelle 30 andere kandidaten gibt. Was nicht kompliziert ist die tatsache das Rf8? sofort verliert. Was auch nicht kompliziert ist zu sehen das der Zug Kf8 viel besser ist und der normale SF sieht es nicht obwohl es nur 7 ply sind von dir Anfangs stellung. Hart zu beweisen nach Kf8 ist auch ob A0 es gewinnen kann nach Kf8 obwohl er die vorteile hat. Daher hart zu wissen ist auch wie waere es mit den anderen 30 0.0 Zug Kandidaten gibt es vielleicht ein zug das besser ist fuer Weiss als Rxc5? haette man gewusst das Rf8 -8.18 nicht gespielt wird.... Und hiermit zeige ich den Korrespondenz schachspieler vergleich. Weil diese die suchstaemme ruhig duchforschen und wer Weiss sie haetten sogar nicht Rxc5 gespielt nach annerkennung das Kf8 Schwarz ueberlebt und sollte er ein mal aus der klemme kommen dann zwei Tuerme im Endspiel bleiben immerhin gefaehrlich.

Ich denke mal jeztz kommt 6-12 monate schweigen waehrend die SF gpl programmierer fleissig Ihren program und gleichzeitig A0 verbessern . Und fuer A0 das kostet nichts sie bekommen die verbesserungen wenn sie kommen um sonst

Ja ich weiss ich bin ein Skeptischer Mensch.

Gruss
Nick
Mit Zitat antworten