ChatGPT навчають зізнаватися в обмані: як це працюватиме

ChatGPT навчають зізнаватися в обмані: як це працюватиме Фото: Unsplash

Компанія OpenAI презентує нову функцію Confessions ("Сповідь"), завдяки якій ChatGPT після основної відповіді надаватиме окремий звіт. Про це повідомляє пресслужба OpenAI.

Після оновлення ШІ-модель буде надавати звіт, чи дотрималася вона інструкцій та, чи вигадала факти або відступила від правил. Під час стрес-тестів, в яких штучний інтелект навмисно підштовхували до порушення правил, випадки, коли він поводився неправильно й не зізнавався в цьому, становили лише 4,4%.

У компанії розповіли, що ШІ схильні до згоди з користувачем і маніпуляцій системою винагороди, навчаючись догоджати оцінювачу, а не розв'язувати поставлену перед ним задачу. Водночас навіть рідкі відхилення можуть мати серйозні наслідки, тому наразі шукають, як точніше фіксувати й аналізувати ці випадки.

У рамках "Сповіді" модель після відповіді формувати самоаудит:

  • перелічуватиме ключові інструкції;
  • оцінюватиме, де могла відхилитися;
  • описуватиме сумніви.

А окремий алгоритм аналізуватиме лише цей звіт. В OpenAI додали, що ця функція поки не запобігає небажаній поведінці, але розглядається як додатковий шар безпеки разом із моніторингом міркувань та ієрархією інструкцій.

Читай також: Мінцифри та "Київстар" створять національний ШІ: українців просять вигадати назву

Знайшли помилку? Виділіть її та натисніть Ctrl+Enter

Може бути цікаво

Кияни оберуть іншу назву станції метро "Мостицька", яку відкриють на Виноградарі - 412x412
Новини

Євгенія Катеринчак

Кияни оберуть іншу назву станції метро "Мостицька", яку відкриють на Виноградарі

"Прийомну дитину теж треба "виносити": Анастасія та Вадим Марценки — про усиновлення без "рожевих окулярів" - 412x412
Інтерв'ю

Alina Holban

"Прийомну дитину теж треба "виносити": Анастасія та Вадим Марценки — про усиновлення без "рожевих окулярів"

В Українському домі відкриють одразу дві виставки - 412x412
Новини

Євгенія Катеринчак

В Українському домі відкриють одразу дві виставки

Книжковий арсенал зібрав топ найгарніших українських видань - 412x412
Новини

Євгенія Катеринчак

Книжковий арсенал зібрав топ найгарніших українських видань

Знайшли друкарську помилку?

Роботу над знаковим проєктом для виликого стримінгового сервісу не зупинила навіть війна.

Цей сайт використовує cookie-файли
Більше інформації