Падтрымаць каманду Люстэрка
Беларусы на вайне
  1. «То, что Лукашенко не признал Крым, страшно раздражало Путина». Большое интервью «Зеркала» с последним послом Украины в России
  2. В Польше подписан закон, который касается и беларусов. Что меняется для мигрантов
  3. Стали известны зарплаты старших сыновей Лукашенко
  4. Легко ли беларусу устроиться на фабрику, куда Лукашенко пригласил мигрантов из Пакистана
  5. «Впервые за пять лет попросили показать второй паспорт». Как проходят проверки на границе Беларуси с ЕС
  6. Пропагандистку Ольгу Бондареву отчислили из университета
  7. Зачем Беларуси пакистанские рабочие и готово ли общество их принять? Мнение Льва Львовского
  8. «Это недопустимо». Лукашенко в очередной раз потребовал разобраться с вечной проблемой Минска
  9. США отменили гранты на демократию для стран бывшего СССР, в том числе Беларуси
  10. Десятки случаев. Узнали, как проходят проверки КГБ на железной дороге
  11. Основатель NEXTA попал в список Forbes «30 до 30»
  12. Что умеет программа, которой беларусские силовики «вскрывают» смартфоны? Рассказываем
  13. Российские войска перебросили дополнительные части под Торецк и активизировали использование бронетехники — с какой целью
  14. «Перад вачыма стаіць скурчаная Марыя Калеснікава, якую цягнуць з ШІЗА». Экс-палітзняволеная — пра жахі турэмнай медыцыны
  15. Лявончык пра Мельнікаву: «Ёсць інфармацыя адносна яе магчымага маршруту»
  16. «Мальчики не хотели причинить вреда девочкам. Они просто хотели их изнасиловать». История трагедии, в которую сложно поверить
  17. Кухарев заявил, что минчане получают по тысяче долларов в среднем. Но чиновник не учел важный момент


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.