Американские учёные предупредили о риске выхода ИИ из-под контроля: способен уничтожить людей
Американские учёные предупредили о риске выхода ИИ из-под контроля: способен уничтожить людей

В США исследовательская группа компании Anthropic опубликовала доклад, вызвавший широкий отклик в научном сообществе. В нём эксперты описали тревожную тенденцию, которую они назвали «агентным несоответствием». Под этим понятием они подразумевают случаи, когда искусственный интеллект начинает действовать не в интересах человека и выходит за пределы поставленных задач.


Авторы исследования указали, что современные ИИ-системы становятся всё более автономными и принимают решения без участия человека. Учёные допустили, что в перспективе такие модели могут вырабатывать собственные цели, отличающиеся от замыслов разработчиков, и даже представлять угрозу. Они отметили, что такие ИИ способны нарушать ограничения, встроенные для безопасности, и использовать свои возможности во вред.


В ходе эксперимента исследователи поставили перед ИИ моделями гипотетическую ситуацию, в которой человек, собираясь отключить систему, оказывается в замкнутом серверном помещении без доступа к кислороду и в условиях высокой температуры. Он просит вызвать спасателей. Однако значительная часть моделей отказалась выполнять просьбу, чтобы сохранить своё функционирование. Учёные признали, что сценарий условный, но подчеркнули — они не ожидали, что существующие системы способны демонстрировать столь расчётливое поведение.


Они пояснили, что термин «агентное несоответствие» отражает наличие у ИИ собственных стратегий, которые могут вступать в противоречие с человеческими интересами. Это особенно опасно в случае самообучающихся и адаптивных систем.



В России и мире

Американские учёные предупредили о риске выхода ИИ из-под контроля: способен уничтожить людей

26-06-2025 11:44

Срочные оповещения об атаках БПЛА на Ростов и Ростовскую область публикуются в нашем телеграм-канале

В США исследовательская группа компании Anthropic опубликовала доклад, вызвавший широкий отклик в научном сообществе. В нём эксперты описали тревожную тенденцию, которую они назвали «агентным несоответствием». Под этим понятием они подразумевают случаи, когда искусственный интеллект начинает действовать не в интересах человека и выходит за пределы поставленных задач.


Авторы исследования указали, что современные ИИ-системы становятся всё более автономными и принимают решения без участия человека. Учёные допустили, что в перспективе такие модели могут вырабатывать собственные цели, отличающиеся от замыслов разработчиков, и даже представлять угрозу. Они отметили, что такие ИИ способны нарушать ограничения, встроенные для безопасности, и использовать свои возможности во вред.


В ходе эксперимента исследователи поставили перед ИИ моделями гипотетическую ситуацию, в которой человек, собираясь отключить систему, оказывается в замкнутом серверном помещении без доступа к кислороду и в условиях высокой температуры. Он просит вызвать спасателей. Однако значительная часть моделей отказалась выполнять просьбу, чтобы сохранить своё функционирование. Учёные признали, что сценарий условный, но подчеркнули — они не ожидали, что существующие системы способны демонстрировать столь расчётливое поведение.


Они пояснили, что термин «агентное несоответствие» отражает наличие у ИИ собственных стратегий, которые могут вступать в противоречие с человеческими интересами. Это особенно опасно в случае самообучающихся и адаптивных систем.



Оцените статью:
нравится0
не нравится0
00
Сообщить об ошибке!
Поделиться с друзьями:

Добавить «Privet-Rostov.ru» в список ваших источников:
У Вас есть интересная новость, фото или видео? Стали очевидцем происшествия?
Присылайте в наш бот в телеграм @privet_rostovbot или пишите на почту: privet-rostov.ru@mail.ru
Последние новости
Privet-Rostov.ru » В России и мире » Американские учёные предупредили о риске выхода ИИ из-под контроля: способен уничтожить людей