Test2, не понял смысл твоего вопроса.
Я говорю о том, чтобы поставить ограничение для ИИ, что любое "важное" решение он обязательно должен согласовывать с людьми, предоставляя корректную информацию о последствиях этого решения, после чего люди принимают или не принимают его.
Если говорить конкретно о, например, Libratuse, то его можно контролировать тем что он выдаёт список вариантов действия с их ЕВ, а разработчики выбирают какой-из них будет реализован (сам он, естественно, выбрал бы вариант с наибольшим ЕВ).
P.S. Я очень надеюсь на какие-нибудь ссылки по этому вопросу, если нет на русском, то хотя бы на английском. Я вроде прочитал немало на джипси (включая ссылки на, наверное, большинство или даже почти все упомянутые там русскоязычные статьи) на эту тему (включая и
этот пост Слона, плюсанувшего Nameless'a), но не заметил противоречия моему предложению (по сути, сделать целевую функцию с множителем - индикаторной функцией, где 1 означает согласие людей, а 0 (ну или -∞) - несогласие, т.е. ИИ максимизируя целевую функцию не должен получить результат, не устраивающий человечество).
Я говорю о том, чтобы поставить ограничение для ИИ, что любое "важное" решение он обязательно должен согласовывать с людьми, предоставляя корректную информацию о последствиях этого решения, после чего люди принимают или не принимают его.
Если говорить конкретно о, например, Libratuse, то его можно контролировать тем что он выдаёт список вариантов действия с их ЕВ, а разработчики выбирают какой-из них будет реализован (сам он, естественно, выбрал бы вариант с наибольшим ЕВ).
P.S. Я очень надеюсь на какие-нибудь ссылки по этому вопросу, если нет на русском, то хотя бы на английском. Я вроде прочитал немало на джипси (включая ссылки на, наверное, большинство или даже почти все упомянутые там русскоязычные статьи) на эту тему (включая и этот пост Слона, плюсанувшего Nameless'a), но не заметил противоречия моему предложению (по сути, сделать целевую функцию с множителем - индикаторной функцией, где 1 означает согласие людей, а 0 (ну или -∞) - несогласие, т.е. ИИ максимизируя целевую функцию не должен получить результат, не устраивающий человечество).