Цитата (scorpchess @ 04.10.22)Скорее всего даже человек с 2800 время от времени белыми будет делать ничью против идеальной игры.
очень большие сомнения)) если только движок не дает какой нить гандикап в виде пешки, или 2 ходов причем это даже не альфазиро)
https://www.youtube.com/watch?v=I2brsZxNY2Q
или фигуру за пешку
А где-то можно сыграть в общем доступе с Альфа-зеро?
Цитата (Ansomon @ 04.10.22)по той же причине, почему у людей предел около 2900
Зайдем с другой стороны.
Почему для движков не создана своя рейтинговая система, которая через какие-то костыли могла бы сравниваться с Эло людей?
Очевидно же, что движки находятся вне рангов нынешней системы. Мы же не пытаемся условного кота встроить в систему Эло за явной абсурдностью идеи. Хотя у кота, думается, будет побольше шансов свестись в ничью или выиграть против гросса тыкая лапой по фигурам и шевеля усами, чем у гросса против бота. И это при полном отсутствии какого-либо понимания концепций со стороны кота. Т.е. дела в качестве игры человек-машина на несколько порядков хуже, хотя гроссы и оказывают очень долгое и упорное сопротивление в партиях.
Цитата (Ansomon @ 04.10.22)очень большие сомнения)) если только движок не дает какой нить гандикап в виде пешки, или 2 ходов причем это даже не альфазиро)
https://www.youtube.com/watch?v=I2brsZxNY2Q
или фигуру за пешку
В шахматах очень большой запас ничейный, тем более у белых. Да, это будет редко, но уверен что сделать ничью тот же Карлсен раз из 10 сможет.
Собственно и приведенные партии завершились вничью, т.е. компьютер отстоял изначальную недодачу в 2 пешки, в то же время для выигрыша бывает недостаточно и формального преимущества в 6 пешек.
Цитата (alchx @ 04.10.22)Очевидно же, что движки находятся вне рангов нынешней системы.
Да, вполне очевидно что это так. Рейтинг Эло у компьютеров отражает какую-то разницу между ними, но по факту не имеет никакого отношения к человеческому - можно даже сказать, что это просто красивые циферки для зрителей. Возможно, что рейтинг компов имеет какую-то историческую точку отсчёта - например, матч компа с Крамником, но сейчас нет особого смысла в этом копаться. Точно так же можно сравнивать по рейтингу Эло силу игры современных топ-игроков с чемпионами прошлого.
Цитата (Vidnovchanin @ 05.10.22)Да, вполне очевидно что это так. Рейтинг Эло у компьютеров отражает какую-то разницу между ними, но по факту не имеет никакого отношения к человеческому - можно даже сказать, что это просто красивые циферки для зрителей. Возможно, что рейтинг компов имеет какую-то историческую точку отсчёта - например, матч компа с Крамником, но сейчас нет особого смысла в этом копаться. Точно так же можно сравнивать по рейтингу Эло силу игры современных топ-игроков с чемпионами прошлого.
Современные 2800 круче 2800 20 лет назад или наоборот?
Korsiccc, а кто круче - Фёдор Хольц или Стю Унгар?
Korsiccc, ну почему же - для онлайна есть pocketfives. Просто не имеет смысла сравнивать сегодняшних топов с топами нулевых, у которых не было софта для работы над игрой. Аналогично и в шахматах, где работа с компом сейчас очень важна - у топ-игроков девяностых и нулевых не было таких технических возможностей, поэтому сравнение силы игры (тем более по рейтингу) на мой взгляд не имеет смысла.
В дополнение к переводу на главной о читерстве Нимана, простым языком https://www.sports.ru/tribuna/blogs/interval/3082903.html
Сайт вычисляет совокупный показатель силы. Оценка силы — это измерение сходства между ходами, сделанными игроком, и ходами, предложенными шахматным движком как «самые сильные ходы». Показатель силы варьируется от 0 до 150, где 150 – ближе всего к «идеальным шахматам».
Оценка в 100 пунктов – ориентировочно самый высокий показатель для людей, которого можно достичь за несколько партий, оценка 90 – самый высокий балл, который выдерживал топ-игрок в течение определенного периода в классических партиях с контролем времени. Использование шахматного движка повышает этот показатель от 125 до 150.
Для игроков калибра Ниманна оценка силы служит внутренним предупреждением, которое указывает на необходимость дальнейшего анализа. Когда он признался в читерстве в 2020-м, у Ханса был показатель силы 85,50. Его он достиг с помощью мошенничества. Эта цифра находилась в диапазоне очков силы (от 103,27 до 69,91), полученных из отчетов сайта о игроках, профиль которых был забанен.
Все они, включая Ханса, признались в мошенничестве.
Я так понимаю, что по данным chess.com и их статистическому методу лучшие честные игроки в среднем имеют что-то около 67-69 очков, выдавая под 90-100 только в суперсостоянии и/или при стечении факторов - разобрал какие-то ветки и опп играет именно по ним - нечасто, но возможно.
Если взять низ в 125 для шахматных движков, то тут просто пропасть в качестве игры человек-машина. И это еще, скорее всего, нелинейная система измерения. Или, возможно, кто-то отчет в оригинале читал и прокомментирует.
При просмотре стрима с разбором финала Непомнящий -- Накамура по шахматам Фишера услышал, что титул в Фишере ценится меньше титула в классических шахматах. Это действительно так? 960 ведь требуют анализа на ходу без заучивания дебютов, т.к. там этих дебютов в разы больше, нежели классики. Т.е. тут проявится не зубрежка, а соображалка. Хотя, некоторые стартеры в 960 совсем ад, типа слонов на угловых клетках и прострелами главных диагоналей с начала партии, как было в Армагеддоне финала.
Цитата (alchx @ 01.11.22)При просмотре стрима с разбором финала Непомнящий -- Накамура по шахматам Фишера услышал, что титул в Фишере ценится меньше титула в классических шахматах. Это действительно так? 960 ведь требуют анализа на ходу без заучивания дебютов, т.к. там этих дебютов в разы больше, нежели классики. Т.е. тут проявится не зубрежка, а соображалка. Хотя, некоторые стартеры в 960 совсем ад, типа слонов на угловых клетках и прострелами главных диагоналей с начала партии, как было в Армагеддоне финала.
конечно, на то они и классические. Турниров в год по шахматам фишера раз-два и обчелся
Цитата (Ansomon @ 01.11.22)конечно, на то они и классические. Турниров в год по шахматам фишера раз-два и обчелся
Хорошо, в 960 поле меньше, денег меньше, а значит меньше конкуренции. Но вот финал ЧМ - игроки ровно те же самые топы, что и в классике, одни и те же лица. Т.е. их мастерство не подвергается сомнению. Они тут скорее не ради денег, а ради очередного кубка на полку и звания в список жизненных достижений. Почему теперь титул 960 все равно ниже титула классики?
Меньше конкуренции -> титул котируется ниже. Вроде логично.
Какова вероятность таких стриков с результатом 45.5 из 46 партий против сильных рейтингов?
Или выборка Крамником составлена как-то неверно?
4000 взято от балды скорее всего (потому что красивое). Такой рейтинг явно недостижим. Скорее всего даже человек с 2800 время от времени белыми будет делать ничью против идеальной игры. А 4000 означает обыгрывание фактически под 0 современные программы. Ну все это с оговоркой, что программы не варятся в собственном соку, а регулярно пусть даже самые слабые из них играют с людьми. Иначе возможна инфляция и рейтинг программ будет мало коррелировать с рейтингом реальным, по которому мы людей оцениваем.
По поводу расчета рейтинга - в каждой партии разыгрывается 10 очков, и, если один получает за победу 0,0..1, то другой соответственно 9,9..9