Байланысты: Халықаралық пед. оқу. жинагы 10-11.04 2024 (1)
ҮЗДІКСІЗ ПЕДАГОГИКАЛЫҚ БІЛІМ БЕРУ: ӨЗЕКТІ ПРОБЛЕМАЛАРЫ ЖӘНЕ ПЕРСПЕКТИВАЛАРЫ НЕПРЕРЫВНОЕ ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ: АКТУАЛЬНЫЕ ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ 57
Благодаря расширенному алгоритму поиска оптимальных ходов и большой шахматной базе
для анализа он стал сильнейшей шахматной программой, которая не использует
графический процессор (GPU). Идеология Stockfish как свободного движка с открытым
исходным кодом сделала его популярным для модификаций и встраивания в различные
системы
–
например, такие, как сервис Lichess.
В 2017 году компания DeepMind разработала самообучающуюся нейронную сеть
AlphaZero. Потренировавшись всего 24 часа, она победила сильнейшие программы по
играм в шахматы, сеги и го.
Это не традиционный шахматный движок: для Al
phaZero [1]
не прописывали сложные
алгоритмы вычисления оценки, как, например, для Stockfish. В его обучении задействовали
технологии Machine Learning. Путем проб и ошибок для изучения каждой новой игры
неподготовленная нейронная сеть разыгрывала миллионы партий против самой себя
случайным образом.
Такой подход называется обучением с подкреплением. Сначала нейросеть играет
совершенно случайным образом, но со временем учится на выигрышах, проигрышах и
ничьих, чтобы корректировать параметры и повышать вероятность выбора выгодных ходов
в будущем. Для выбора наиболее перспективных ходов нейросеть
использовала
поиск по
дереву Монте
-
Карло (MCTS)
Нейросеть AlphaZero
использовалась
в
подготовке Магнуса Карлсена к матчам и
чемпионатам. Отсутствие привязки к алгоритмической и аналитической оценке при выборе
хода сделало ее более изобретательной и непредсказуемой для оппонентов. AlphaZero с
запасом побеждает самые сильные шахматные движки, в том числе и Stockfish. При этом
она оценивает всего порядка 60 тыс. позиций в секунду, в то время как Stockfish
–
60 млн.