Slice of life

478
Статистика
Статистика
478
Статистика темы
  • Популярность
    Топ-207
  • Постов
    3,674
  • Просмотров
    580,470
  • Подписок
    478
  • Карма автора
    +20,074
1 129 130 131 132 184
  • c00l0ne @ 16.09.25 

     ExeRco, сильно пишешь

    Если это решение не использовать в качестве ботов профит низкий... Оно нужно только ботоводам... Думаю давно все посчитали...

    Оно нужно всем. Но ботоводы могут использовать результаты напрямую, а для обычных кожаных мешков нужно ещё всё описать и упростить до каких-то запоминаемых паттернов. 

     

    т.е. чтобы MDA был полезен в качестве обучения надо проделать более сложную работу чем анализ для бота.

    Ответить Цитировать
    413/602
    + 0
  • justpus7 @ 16.09.25 

    Что это такое?

    https://www.hudstore.poker/mda-poker-how-to-use-mass-data-analysis-to-crush-games

    Ответить Цитировать
    1/11
    + 1
  • SnowBeaver @ 16.09.25 

    Оно нужно всем

    во сколько бы оценил разработку такой системы ?

     
    Ответить Цитировать
    96/104
    + 1
  •  awakening, всё что ты описал околопокерным разрабам принесли на блюдечке несколько лет назад (до вайб кода ещё). Шаблы оппов не нужны, нужен медиаперсоналити для рынка, который на родном языке расскажет, что ГТО=круто. Почти прямая цитата.

    Точная копия румов с амбассадёнышами. Обложили со всех сторон )

     

    И вместо траты маны на расписывания примеров руками, можно просто фермеров с WPN вспомнить. 76 ников, все без промахов палятся на дефолтном отчёте из трекера:

    1) Смотришь сколько регов сыграли в их стиле (красная не в помойке) и плюсанули. 6 ников (СБ трудится в поте лица, рейк 10бб за проезд передаём).

    2) В какой-то изолированной ноде(споте), можно наблюдать тотал доминейшн. Даже над кластерами Стефа+Линуса+...  И тут вопрос, связанный с темой, которую ты описывал. В ситуации для Сквиза, какую из саб-нод разъёбывают фермеры:

    а) Мультивей пот после колл бехайнда, где 3+ игрока и странные+гуляющие рейнджи и у фишей и у регов. Солвера/ГТО по сути нет.

    б) Сквиз ХА 3БП с СПРом даже меньше обычного (т.к. сайзинг на префлопе увеличенный), где солвер/ГТО король точного просчёта ситуации.

    Сквизером на постфлопе все умеют, а вот с "подстройкой под оппонентов в мультивее" почему то вхлам лучше справляется весёлая ферма. Это ещё у них колл ослабленный из-за широкого сквиза, но они всё равно своё из мультивея забирают (1 рейта), пока реги 0.8 на автопилоте галочку фолда жмут и от укрепления чека страту строят. 

    Более идеальную иллюстрацию твоим постам сложно придумать

    Но 100% "обучающих" видео и разборов рук на форуме будет с "глянем в визарде".

    Ответить Цитировать
    36/42
    + 1
  •  c00l0ne, Я очень хочу сделать по ней MVP, а потом продать инвестору какому-то. Очень сложно оценить в часах то, чего раньше не делали. Я зарою пару месяцев в хобби режиме бесплатно в начале. Потом посмотрим. Конечный результат уже надо обсуждать с теми кто оплачивает банкет

    Ответить Цитировать
    414/602
    + 1
  • Эвристики доступности (читай - упрощения страты на основе имеющихся осознаний знаний об игре и поле) особенно актуальны, когда мультитэйблинг и  "Б авто-пилот".  В нита всегда выкидываю ТП на рэйз терна. а если мы до этого рэйзили пять его ЦБетов и он тильтует? Овербэт от неизвестного - сила. А если тайминг? Человек еще долго будет обыгрывать бота, если умеет внимательно следить за игрой и правильно понимает связки статов ХАДа. Но дипсик все ближе)

    Ответить Цитировать
    2/2
    + -1
  •  moopaz, кого там человек и куда выносит, RTA уже давно закрыл этот вопрос, первому скандалу с skier_5 уже десяток лет. почти уверен чтобы обыгрывать те сетки про которые речь ведет  ExeRco, уже давно надо быть в большей степени пин тестером, а уже потом покерным игроком.

    Ответить Цитировать
    8/8
    + 1
  •  Rumomote, врываешься в какую-нибудь приложуху, где у тебя на ботов по 0 рук, а у них - 80% всех твоих рук, за какими бы столами ты ни сидел. Играешь с ними, они шерят карты и используют стратегии, подстроенные под это поле и этот рейк. Проёбываешь. Потом собираешь сам майнинг на ботов, видишь фишные статы, радостный играешь как против фиша, а это маскирующийся бот. Проёбываешь еще больше. Когда проебал всё, идешь возмущенный к какому-нибудь говноаффу, и он говорит - а что такого, все мои игроки в сумме выигрывают. Правда, забыв сказать, что большинство его игроков и есть боты. А он сам оценивает рум как крайне надежный и с толпами фишей-американских домохозяек (надежным он стал после получения нескольких тысчонок в месяц за это)

    Обиженный идешь на форум, и тебе говорят, что ты играть не умеешь и у тебя даунстрик. И надо просто больше стараться)

    Ответить Цитировать
    530/730
    + 16
  • А есть мож в блоге: 

    1) дата инженер/аналитик, работающий в сфере покера? 

    2) дата инженер/аналитик, работающий в антифроде (необязательно покер)

    мб смогу выгодную работу предложить. Единственное, подразумевается умение писать код и придумывать реально рабочие алгоритмы, а не только тыкать эксель "я аналитик, у меня лапки". (можно всё через чатгпт клепать - это неважно, главное результат)

    я бы предложил  ExeRco, но хозяин-барин, и, как водится, нужен кто-то с "опытом" либо достижениями в этой или какой-то смежной сфере. всё удаленно, локация не важна вообще. В крайнем случае, хотя бы познакомимся

    Ответить Цитировать
    531/730
    + 1
  •  awakening, Я думаю, что ты уже всех покерных аналитиков русскоязычных трудоустроил :)

    Ответить Цитировать
    415/602
    + 0
  • Несколько полезных концептов из всех разновидностей бенчей ЛЛМок:

    1) Резонки("думающие") модели лучше во всех сферах. Поэтому если влом заморачиваться и нужен один источник качественных ответов - выбор очевидный. 

     

    Тем более что платные разрабы полностью забили на улучшение обычных моделей, это для них в перспективе просто быстрый/дешманский вариант, не уступающий конкурентам. Сам проверил это на элементарной комбинаторной задаче, там деградация и все те же ошибки что ~2 года назад.

    У "думающих" будет ожидаемая проблема с удорожанием подписки и развитием в сферах, которые вам нах не упали. Но если всё устраивает, то можно и дальше привычно пользоваться и не париться.

    Вся дальнейшая инфа про оптимизацию, грамотный подход, цена/качество и соответствующие заморочки.

    2) В нишевых/простых задачах, резонки могут быть overkill'ом. Либо китайские, либо обычные модели могут быть того же кач-ва

     

    В креативных писульках и roleplay тоже отрыва нет. И простые модели будут отличаться только повышенным гоном, повторением, опечатками и т.д. Само содержание у них может быть поинтереснее.

     

    Так что жечь токены топ качества не всегда целесообразно.

    3) Послушность / "делает что говорят" у моделей существует + проявляется в писанине, как и писал кодошизик тут

    https://forum.gipsyteam.ru/index.php?viewtopic=151513&view=findpost&p=8096296

     

    Claude не видно, потому что он прямо сейчас переписывает ваш код как ему вздумается. Но если серьёзно, то задачи, где всё ясно и от LLM нужно напечатать и пробелы заполнить, лучше делать с более покладистыми разрабами. Меньше маны потратите.

    4) Области безразличия в противостоянии резонок. С одной стороны, это то что их качественно отделяет от обычных моделей. Понимание текста, смысла, содержания. STEM и олимпиадная математика. Общие рассуждения и знания предметных областей. Логические загадки, парадоксы и т.д. С другой стороны, все они уже на таком крутом уровне, что внутривидовых различий почти нет

       

     

    То же самое, что и в пункте 2. Если китайская моделька даже где-то лучше в математике, зачем по вопросам формул и вычислений беспокоить более дорогих / привычных провайдеров.

    5) Проблемы, от которых даже резонка не спасёт. Типовые проблемы LLMок с неподъёмной сложностью задач, искажённым порядком, упусканием смысла. Сумбурно описывал тут:

    Опять же две стороны медали. Вроде ЛЛМ для того и нужна, чтобы из фристайл писанины выдёргивать смысл. И именно опечатками, пропуском этапа в алгоритме, своеобразными формулировками смысла мы и "общаемся" с ними. Но любой бенч, который хулиганит с дефолтами , сразу рушит % эффективности

     

    Небольшой шаффл, и восстановление сценария и связи между словами слетают даже у топов. У агентских бенчей вообще 30%+ выполнения задач это элитный показатель. 

    Так что нужно использовать для чего-то прямолинейного и подъёмного. Иначе будет классика: "впизду->start new chat".

    Вот пример, когда "кодерская" модель не тянет свою специализацию.

     

    Здесь камень преткновения в скрытых от юзера настройках и желании "лениво кодить", у резонок тоже такой потолок будет на этажах повыше. 

    6) Специализация и преимущества/слабости. Здесь индивидуально всё будет под задачи или сферу деятельности. Но вот что по кодингу получается: 

    Очень много свежих бенчей делает упор на разделение показателей. Вместо общей оценки, как можно больше релевантных составляющих этой оценки (дата аналитики ставят лайк). Это позволяет слабые/сильные специализации определить. И показывает разницу между подровнявшимися по общему качеству моделями топов.

    Вот сравнение по ЯП

     

    В целом всё равномерно, но ковыряться в Расте даже с свежей резонкой будет в разы сложнее, чем в Питоне с чёрствой старухой -mini-fast-noreason(preview). То же самое с абстрактыми джойнами таблиц, которые лучше делаются SQL only коммерческими агентами, а лучший Клод с агентом-костылём жрёт токены чтобы быть на 4-м месте. Т.е. перед тем как начать что-то делать, можно узнать какой уровень у ЛЛМок в этой области. 

    Но более ценная инфа это сила/слабость моделей в чём-то конкретном + практическом. Вот примеры:

     

    Одна лучше пишет комменты и понимает архитектуру. Другая лучше читает кодбазу и связи между файлами. Третья даёт лучшие советы при фиксе проблем.любого типа. Под определённую задачу нужно брать сильнейшую в ней модель. Разница не всегда значительная, но, как видим, провалы в каких-то закутках случаются.

    Ну и вот последний пример, чтобы всё собрать воедино

     

    Категории и проект абстрактные, но на их примере:

    а) Безопасность у всех слабая, т.е. это нужно будет хоть как доделывать самому. И возможно следует это изначально поставить в топ приоритет. Посидеть, почитать, повникать. Очень часто из-за этого потом приходится переделывать, т.к. "доверился" дефолтному алгоритму, а это явно не сильная сторона ллмок.

    б) У слабых моделей нет качества кода, но есть его стабильная выдача. Т.е. вместо отправки его в мусорку, можно глянуть что за единственная вариация предлагается. И потом, если предлагают такое же, но лучше обставленное, будет повод подумать: "красим стены лаком для ногтей поносного цвета, но красит Рембрант?" 

    в) Качественные модели наоборот могут быть использованы как одобряющие. Если у них высокое качество и всё делается в одной вариации и она совпадает у разных разрабов, значит так эта задача и решается. И если у нас понимание, что это не годится или делается по-другому, то можно их ассист сбросить до уровня генерации кусков/функций. И условный Дипсик / ГПТ будет взять разумнее, т.к. они лучше Клода слушаются, хотя показатели/качество у них похуже.

    А если напрямую рубить, можно море маны потратить на игноре всех этих ньюансов.

     

    P.S.: 

     

     

    Ответить Цитировать
    37/42
    + 14
  •  ExeRco, а я в claude code освоил супер-параметр "claude --dangerously-skip-permissions". С ним оно может писать код, менять любые файлы, запускать, смотреть что в результате запуска. И не будет на каждый шаг спрашивать подтверждения. Так что иногда можно просто задать какой-то критерий, который меня устроит в выходных данных и уйти пить кофе. Иногда получается. Пока что пользуюсь в текущей работе подпиской за 100$. 

     

    Там у тебя отрыв между конкурентами какой-то в доли процента местами. Что говорит как-бы, что они все работают. Теперь наверное надо смотреть больше на то, какие удобнее использовать. Я пока на чём-то рабочем сравнил claude code vs cursor (claude, gpt). Форм-фактор консольной утилиты очень зашёл. я могу например на любом сервере запустить и попросить изучить чё и как установлено сэкономив время. Или в любой папке на компе могу попросить изучить проект выдав саммари. Под проектом можно подразумевать не только код. Какие-то личные заметки упорядочить оно тоже наверное сможет. 

     

    авто-дополнение в коде мне не зашло ни в одной системе что пробовал. с запросами по математике и вообще всему где надо думать нужно быть аккуратнее. Оно по запросу может тебе соединить ужа с ежом и будет на любой ввод говорит - "отличная идея", давай попробуем. Мне не хватает скептического режима уровня старых форумов. Когда если тупой вопрос задаёшь, то тебе объяснят почему вопрос тупой, а сам ты мудак. Потом уже может помогут. Для эго неприятно, для работы полезно. Ещё очень пригодилась бы утилита в таком же формате как claude code, но standalone. Готов смириться с тем, что она будет тупой. Я бы нашёл применение на серверах закрывать рутинные задачи, ну и в плане использования в своём коде как компонент было бы интересно. Вроде такие опции существуют.

    Сообщение отредактировал SnowBeaver - 2.10.2025, 15:10
    Ответить Цитировать
    416/602
    + 2
  • SnowBeaver @ 02.10.25 

    Там у тебя отрыв между конкурентами какой-то в доли процента местами. Что говорит как-бы, что они все работают. Теперь наверное надо смотреть больше на то, какие удобнее использовать.

    Да, 1) и 2) об этом и были. Все вариации не распишешь, но удобство/функционал это другая тема немного. И там постоянно прогресс идёт, что-то добавляют их нехватающего. Гугл вон сделали MCP, чтобы всё прокликивалось / тестилось само. Для агентов и "вари горшочек" подходов будет нужный костыль. Но это важно для тех, кто этим занимается. Так что через сито своих нужд / приоритетов эту инфу нужно пропускать.

    Более общий посыл про КПД заморочек был в том, что всем не помешает быть осведомлённым в своей области. Всё меняется, китайцы и гугл догоняют. Бенчи из поисковика могут быть старые, подзалупные (тесты под тех, кто спонсирует), глупые. Но ресёрч по теме бенчмарков идёт внушительный, много неглупых людей пытаются разобраться. Paper они все выкладывают, можно детально ознакомиться и найти очень важные для ваших целей параметры, которые протестированны грамотно+качественно. 

    SnowBeaver @ 02.10.25 

    Мне не хватает скептического режима уровня старых форумов. Когда если тупой вопрос задаёшь, то тебе объяснят почему вопрос тупой, а сам ты мудак. Потом уже может помогут. Для эго неприятно, для работы полезно.

    Их симбиоз не интересует, это уже очевидно. 0 прогресса в плане уточняющих вопросов, улучшения архитектур/алгоритмов, анализа инструментов перед их использованием. Про причины можно только гадать, но наверняка что-то типа:

    -люди сами не знают, что хотят

    -то что люди хотят и что продаётся это "двое из ларца", а деморализующюю печку не спрашивали

    -"архитектура" ЛЛМ и тренинга не позволяет прокачивать скилл "задавать релевантные вопросы", т.к. слишком тонкие материи

    -даже там, где у ЛЛМ 100% эффективности (чтение нефрагментированных текстов) у них гарантированные галлюны. Может стремления рандомизировать аутпут конфликтует со здравым смыслом. 

    -а есть ведь ещё области где у них 40% эффективности

    Так что этот функционал можно и не ждать. Айронмэн сам придумывал, и нам завещал.

    Ответить Цитировать
    38/42
    + 0
  •  ExeRco SnowBeaver, накидали накидали на вентилятор 

     

    напишите с чем не сможет справиться современный трансформер ? с какой задачей ? 

    при условии что компут (мощность вычислений) не ограничен ... бюджет тоже ...

     

    мои имхо современный трансформер идет к AGI семимильными шагами ... 

    а вот для ASI надо будет менять скорее всего архитектуру...

    чтобы сеть могла в реальном времени дообучаться...

    ну а дальше уже думать не надо )))

     

    Ответить Цитировать
    97/104
    + 0
  • ExeRco @ 02.10.25  

    них гарантированные галлюны

    в целом самая сложная задача заставить нейронку работать с невероятно длинным (желательно бесконечным) контекстом "без потерь " 

    вот например советы для клауда с их сайта 

    многие пишут 

    "проанализируй этот текст : <текст>"

    а нужно писать 

    "<текст> сделай анализ"

     

    но это еще раз доказывает что нейронки сильно "шумят" и контекст не равномерно учитывается

    работы на эту тему : 

     

    Сообщение отредактировал c00l0ne - 3.10.2025, 2:24
    Ответить Цитировать
    98/104
    + 0
  • ExeRco @ 02.10.25 

    -то что люди хотят и что продаётся это "двое из ларца", а деморализующюю печку не спрашивали

    охуенная метафора, взял на вооружение

    -даже там, где у ЛЛМ 100% эффективности (чтение нефрагментированных текстов) у них гарантированные галлюны. 

    Ну, справедливости ради можно сказать, что живых людей тоже троит неслабо. И любой программист может сделать ошибку в любом месте просто рандомно. Даже тривиальном. Типа я стараюсь уменьшать свою критичность к инструменты вопросами "а я бы с нуля если это писал, то сколько бы ошибок сделал?".

     

    Мой подход это не ходить к LLM за экспертностью, а закрывать рутину. Ну не хочу я новый модуль руками создавать, который на старте просто должен прочитать csv в dataframe или сделать list по S3 и по какой-то маске файлы выбрать. Если что-то прошу, что я не на 100% сам с нуля могу написать, то воспринимаю код сугубо как черновик. Но даже при таком подходе уже делал дорогие ошибки из-за того, что бездумный код попадал в рабочий проект.

    Ответить Цитировать
    417/602
    + 2
  • c00l0ne @ 03.10.25  

     ExeRco SnowBeaver, накидали накидали на вентилятор 

    напишите с чем не сможет справиться современный трансформер ? с какой задачей ? 

    С любой где надо думать, и в процесс включены работа с людьми, утрясание мнений, хотелок и ожиданий. Короче с работой программиста. Калькулятор может перемножить любые числа, но Бабу Машу на кассе не заменяет. 

    Горячее мнение) Оптимус Прайм из Robot Chicken - лучший Оптимус Прайм :  r/transformers

    Я стараюсь активно изучать новые инструменты. Пока у меня мнение, что я не могу по настоящему уйти в отрыв из-за цены ошибок. Чем более правдоподобен выдаваемый код, тем сложнее потом находить в нём ошибки. И чем сильнее расслабил булки на этапе продумывания логики, тем бесполезнее потом работающий код если что-то пошло не так. Мне кажется, что все ребята, кто считает, что надо просто дождаться самой крутой и эффективной LLM на деле просто не разрабатывают сами. Иначе бы вся очевидность процесса встала бы перед ними в полный рост. Типа, я экономлю 2 часа на написания кода руками чтобы потом на 10 часов больше просидеть в отладке если делаю задачи "агентского" уровня, а не просто использую LLM для ускорения печатания знаков.

     

    Баба маша на кассе, которая продолжает перемножать столбиком карандашиком на бумажке, конечно же будет недостаточно эффективна для своей работы. Но калькулятор освоить не так сложно. Это не меняет работу по сути.

    Сообщение отредактировал SnowBeaver - 3.10.2025, 5:59
    Ответить Цитировать
    418/602
    + 1
  •  
    SnowBeaver @ 03.10.25 

    Бабу Машу на кассе не заменяет

    Баба Маша лишнее звено) (возможно самое слабое )

    SnowBeaver @ 03.10.25 

    ожиданий

    не согласен, трансформер сразу четко и ясно дает понять какие будут возможности , оценить производительность , не дает конечно идеальных "решений" , но в целом это есть , оценка производительности

    SnowBeaver @ 03.10.25 

    мнений, хотелок

    ну тоже не соглашаюсь , кастом делает трансформер тоже порядочный, что хочешь то допилит ... 

    SnowBeaver @ 03.10.25 

    Калькулятор

    не калькулятор это, а система подобная мозгу человека, с очень сложными алгоритмами внутри ... обработки входных данных ...

    Ответить Цитировать
    99/104
    + 0
  • SnowBeaver @ 03.10.25  

    И чем сильнее расслабил булки на этапе продумывания логики, тем бесполезнее потом работающий код если что-то пошло не так.

    ну хочется тебя чуть чуть в русло направить более правильное что-ли 

    есть потраченная энергия : 

    есть llm дешевые по энергии , обычно их используют в агентских режимах , типо клауда и там бесплатных и прочий хлам ... 

    да код пишет но структуру глубокую чаще всего не понимает , плюс к тому же какие-то нью фичи не добавляет , все это самостоятельная работа домашняя часто ... но в целом скелет пишется ... 

    в основном сейчас все занимаются этим , запускают дешевые по энергии сетки , пишут там код который в принципе в природе существовал и существует уже давным давно , ничего нового не пишется естественно в 99% , просто как из книжки по движению волшебной палочки возникают буковки ... 

    дешево = не качественно 

    есть мощная ризонинг модель gpt-5 pro , она само собой не используется потому что дорого богато качественно оч медленно , т.е. нереально ее использовать для дешевой работы ... 

    но я вижу потенциал допустим проверить уже созданный   дешевой моделью код  более дорогой , найти допустим ошибки в коде в логике ... 

    это дорого но это еще и приносит новые идеи ... gpt-5 pro способна уже доказано генерировать новые идеи алгоритмы и методы решения задач ... 

     

    т.е. в идеале агентная система по написанию кода выглядит так : 

    1. мы запускаем самую дешевую вонючую модель 

    2. мы средней моделью исправляем косяки первой модели 

    3. мы дорогущей моделью полируем код до идеального по мнению модели состояния

    4. человек доводит код до своего экспертного уровня

    5. переходим на п.1 

    и цикл бесконечный)

    Сообщение отредактировал c00l0ne - 3.10.2025, 6:19
    Ответить Цитировать
    100/104
    + 0
  •  c00l0ne, я готов обсуждать модели лопат когда мне есть чего ими копать :) чтобы я что-то начал пробовать для этого должны возникнуть экономические причины. Я должен захотеть инструмент. Мне не нужен инструмент, который будет за меня думать. И моему заказчику не нужно чтобы за меня думал инструмент. 

     

    Пока всё развитие AI не привело ни к сокращению числа программистов, ни к уменьшению востребованности ремесла. Просто теперь в стеке появился новый инструмент, который добавился к множеству других у программиста. Не случилось не просто революции, а даже качественного перехода. При этом инструмент этот с побочками примерно также как вкусные тортики если ими полностью заменять рацион питания. У тех, кто вовремя развил свою нейросеть работа становится всё легче, а конкуренция всё ниже. При этом тренд сохраняется не только в программировании.

    Ответить Цитировать
    419/602
    + 4
1 129 130 131 132 184
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.