– Nie było momentu, w którym bym czuł, że prowadzę – powiedział Lee Sedol, 18-krotny mistrz świata w go, gdy 15 marca 2016 roku, po sześciu dniach walki, ogłoszono jego porażkę w rozgrywce z maszyną. Zwycięzca, algorytm AlphaGo zaprojektowany przez londyńskie laboratorium DeepMind, „zgarnął” milion dolarów nagrody. I sławę pierwszej maszyny, która pokonała jednego z największych mistrzów w dziejach tej starożytnej gry.
Jak do tego doszło? Najpierw dzięki głębokiej sieci neuronowej maszyna przyswoiła sobie dziesiątki milionów ruchów wykonanych przez najbardziej doświadczonych graczy.
Potem użyto uczenia się ze wzmocnieniem: w milionach rozgrywek różne wersje AlphaGo grały same ze sobą, analizując, które ruchy pozwalają zdobyć na planszy największe terytoria. Tak AlphaGo odkrywał dla siebie nowe strategie.
Wreszcie ruchy z tych meczów wprowadzono do drugiej sieci neuronowej. Ta wyszkoliła system do badania potencjalnych skutków każdego ruchu, patrzenia w przyszłość.