Цитата (БиллиУбили @ 4.6.2020)
У меня состояния состоят из Руки, а она из карт. И, к большому сожалению, руки из разных узлов не пересекаются: рук очень много, искать одинаковые в разных ответвлениях - времени не хватит
Цитата (БиллиУбили @ 4.6.2020)
Это понятно, я спрашивал про другое. Когда мы ищем узел для обхода по UCT, мы начинаем обход с корня(с самого начала). Вопрос: если мы руками пропустим уровень(вниз) и руками назначим "начало обхода" = произвольный узел - формула поломается или будет работать?
Цитата (БиллиУбили @ 4.6.2020)
так чего его смотретьh if (tempNode.playerNo == boardStatus && boardStatus == opponent)
{
node.parent->winScore -= 10000;
}
else if (tempNode.playerNo == boardStatus && boardStatus == me)
{
node.parent->winScore -= 10000;
}
// int count = 0;
while (boardStatus == IN_PROGRESS)
{здесь продолжение по рандому
Цитата (БиллиУбили @ 4.6.2020)
К сожалению, крестики-нолики - не Китай. Здесь 8-9 возможных ходов, в Китае ~С(45,3)
Планирую добавлять их(потомков к узлу) по рандому, пока будет хватать времени...
Цитата
сколько успеем просимулировать "первых" подьёмов, из них и будем выбирать "лучший" ход
Теоретически возможно, что "самый лучший" ход и не попадёт в наше дерево
Цитата (c00l0ne @ 4.6.2020)
поэтому и нужна абстракция, Китайский напрямую тебе не решить
Цитата (c00l0ne @ 4.6.2020)
ты на основе 10 посещений будешь ходы выбирать ?
Цитата (БиллиУбили @ 4.6.2020)
Друг, это и есть основная идея алгоритма.
1. Великий рандом уравняет всех(все продолжения)
2. Нам нужно найти не самый лучший ход, а самый лучший ход из исследованных
будет 10 обходов(посещений) - будет одна картина
10000 обходов - другая
Цитата (БиллиУбили @ 4.6.2020)
c00l0ne, опять эти грёзы о Калифорнийских серверах с 1000ядерными процессорами
Идеи, как упростить, есть. Но сначала надо сделать реализацию без упрощений.
У тебя готовый, рабочий код для крестиков-ноликов. Сделай доску 10Х10... 20Х20... На каком размере алгоритм "сломается"?
Цитата (c00l0ne @ 4.6.2020)
поэтому и нужна абстракция, Китайский напрямую тебе не решить
лан бай пиши в телегу зарегайся ... у меня там есть пара знакомых программистов , тоже твоей темой занимаются ...
Цитата (БиллиУбили @ 4.6.2020)
На каком размере алгоритм "сломается"?
Цитата (c00l0ne @ 4.6.2020)
как описать эти трилионы трилионов состояний
Цитата (БиллиУбили @ 4.6.2020)
Действительно, как описать эти состояния...вот я ставлю нолик в правый верхний угол, потом левый верхний угол...а у крестиков уже 2 крестика в линию и следующим ходом он меня наказывает. До триллионов дело не дошло.
Ты бы статьи про отсечения почитал. Как люди по-человечески это делают)
Цитата (c00l0ne @ 4.6.2020)
как атом цезия играет в крестики нолики на доске 100х100
Цитата (БиллиУбили @ 4.6.2020)
бытует такая байка...что программист написал код АI для ботов Quake...запустил их на арену и забыл...А через год посмотрел, а они стоят на месте. А там логов на 500Мб(по тем временам).
КОроче, выяснилось, что боты нашли лучшую стратегию: не пытаться убить друг друга
Отака *уйня, малята
Спасибо за обьяснения, но я примерно понимаю, как строится дерево и осуществляется поиск "лучшего хода". Естественно, лучший ход мы не найдём, зато ЕВ очень даже