Як відрізнити текст AI від людського: пояснюють головні редакторки "ТиКиїв" та "Новини.LIVE" Ольга Безсонова й Олена Халік

Як відрізнити текст AI від людського: пояснюють головні редакторки "ТиКиїв" та "Новини.LIVE" Ольга Безсонова й Олена Халік Фото: колаж "ТиКиїв"

У цьому році штучний інтелект згенерує інформації значно більше ніж за всю свою історію (за прогнозами його творців). Але все одно він не може тягатися в написанні текстів з людиною. Контент, створений за допомогою ШІ, легко визначити. Як? Розповідають головні редакторки "ТиКиїв" та "Новини.LIVE" Ольга Безсонова й Олена Халік.

Як люди створюють тексти

Фото: Freepik

Текст — упорядкована множина знаків, яка слугує засобом людського спілкування, мислення та вираження почуттів. Оскільки текст будується на основі мови, він є комунікативним феноменом, завдяки та за допомогою якого реалізується комунікативний процес. Людина створює текст, враховуючи свій чуттєвий досвід та соціальний контекст. Вона реагує на наявні дискусії у суспільстві, має власну ідеологічну позицію, яка проявляється у тексті, та пише для конкретної аудиторії, з якою має емоційний зв'язок. Текст може переступати часові межі життя свого творця, інтерпретація текстів-довгожителів, які затребувані в різних контекстах, дає можливість отримання з них нових змістів у кожній новій ситуації прочитання. 

Як штучний інтелект генерує тексти

Фото: Freepik

Сучасні нейромережі, особливо моделі-трансформери (GPT, LLaMA, Claude), працюють на принципово іншій основі. ШІ не "розуміє" текст у людському сенсі. Замість цього він аналізує статистичні патерни — завдяки тренуванню на мільярдах текстів ШІ визначає ймовірності появи певних слів чи фраз після інших. Він оперує векторними представленнями, де кожне слово й поняття представлене як багатовимірний вектор у латентному просторі. ШІ застосовує механізм уваги, який зв'язує різні частини тексту між собою, забезпечуючи зв'язність. І нарешті, він прогнозує наступне слово, обираючи його з розподілу ймовірностей, створеного моделлю.

Чому ШІ не всемогутній? 

Фото: Freepik

ШІ має характерні риси, які відрізняють його від людини, — пояснює головна редакторка "ТиКиїв" Ольга Безсонова. — Насамперед це відсутність реального досвіду та чуттєвого досвіду. ШІ не має власних переживань, спогадів чи відчуттів. Його знання мають статистичну природу, адже інформація ґрунтується на корпусі текстів, а не на живому досвіді. Через це виникають "галюцинації" — генерування правдоподібної, але некоректної інформації.

Також AI (artificial intelligence) властива шаблонність мислення, тобто тяжіння до повторення структур і формулювань, які часто зустрічаються в навчальних даних.

Ми попросили декілька мовних моделей виявити маркети штучного інтелекту в текстах. Отже, ШІ сам розповідає людству про ознаки тексту, написаного ШІ...

  1. Надмірна збалансованість

ШІ намагається розглянути всі сторони питання, уникаючи крайнощів. У текстах часто з'являються фрази: "З одного боку... з іншого боку", "Існують різні погляди на цю проблему", "Варто розглянути як переваги, так і недоліки". Така нейтральність звучить штучно, особливо в темах, де люди зазвичай висловлюються емоційно.

  1.  Стилістична однорідність

Тексти ШІ часто мають шаблонний стиль: схожі довжина речень, структура абзаців, передбачувані переходи між думками, пропорційне чергування простих і складних конструкцій.

Людські тексти більш динамічні: ми можемо писати короткими фразами, потім раптом перейти до розлогих, багатоскладових речень із великою кількістю підрядних, вставних конструкцій та інших елементів, що роблять мову живою й непередбачуваною, — пояснює головна редакторка "Новини.LIVE" Олена Халік.

  1. Передбачуваний словник

ШІ зазвичай використовує найпоширеніші слова та фрази. Він уникає суржику, рідкісних регіоналізмів, специфічного сленгу, мейнстримних фраз, авторських неологізмів, надто розмовних виразів. Коли ШІ намагається використовувати нестандартну лексику, це часто виглядає штучно або недоречно.

  1. Відсутність оригінальності

ШІ складно створювати неологізми, несподівані метафори, порівняння чи ідеї. Його "творчість" — це здебільшого рекомбінація наявних шаблонів, а не створення принципово нового.

  1. "Ідеальні" помилки

Якщо у тексті ШІ є помилки, вони зазвичай логічно послідовні, систематичні, очевидно умисні або очевидно випадкові. Також можна помітити ознаки автоматичного перекладу. Натомість людські помилки часто непослідовні та відображають особливості мислення автора.

  1. Уникнення суперечностей та неоднозначності

ШІ намагається бути логічним і уникати парадоксальних тверджень, складних емоційних станів, суперечливих позицій. Людина часто висловлює суперечливі думки в одному тексті, бо людське мислення само по собі неоднозначне.

  1. Надмірна структурованість

Тексти ШІ часто надмірно структуровані, містять багато маркованих і нумерованих списків, підзаголовків, передбачувані переходи між розділами, шаблонні вступи й висновки.

  1. Стандартизовані посилання й цитати

Коли ШІ цитує джерела, вони зазвичай посилаються на загальновідомі праці, уникають неоднозначних або спірних джерел, а інколи взагалі можуть рандомно генеруватися ШІ та бути фейковими.

  1. Відсутність специфічного культурного контексту

ШІ намагається бути універсальним, тому уникає надто специфічних локальних референсів, використовує загальновідомі культурні паралелі, нівелює національні чи соціальні особливості.

  1. Викривлення часових маркерів

ШІ може плутатися з актуальністю подій, особливо нещодавніх. Він змішує різночасові події, неприродно використовує часові маркери, невпевнено говорить про свіжі події. 

Як виявити, що текст написаний за допомогою ШІ? 

Фото: Freepik

Найефективніший метод — поєднання автоматичних інструментів із критичним мисленням. Незвичайні, яскраві метафори, особисті історії з деталями, стилістична непослідовність, емоційна глибина, використання жаргонізмів та діалектизмів властиві людським текстам. ШІ на це неспроможний, навіть якщо його запромтити проханнями "переписати текст людською мовою". 

Існують спеціалізовані інструменти для виявлення текстів ШІ. Приміром, сервіс GPTZero аналізує "перплексність" тексту, тобто міру його передбачуваності.

Neural writer призначений для розпізнавання тексту, створеного штучним інтелектом, таким як ChatGPT (GPT 3.5 / GPT 4), Bard, Gemini, Llama, Mistral, Mixtral. Цей детектор ШІ може аналізувати есе, новинні статті або простий текст, написаний ШІ.

Writer.com/ai-content-detector визначає ймовірність створення тексту штучним інтелектом.

Content at Scale AI Detector виявляє патерни, властиві ШІ.

GLTR (Giant Language Model Test Room) візуалізує прогнозованість кожного слова.

З'явилося багато сервісів на основі ШІ, що виявляють ознаки ШІ в текстах: просто загугли Free AI Detector (або детектор ШІ) — і знайдеш їх. 

Однак жоден з цих інструментів не дає 100% гарантії, особливо якщо текст був відредагований людиною. ШІ ускладнюється і його ідентифікація — теж. Новітні моделі GPT-4 та Claude 3 вже вміють імітувати людські помилки, використовувати нестандартну лексику, адаптуватися під різні ЦА, враховувати культурний контекст, — зауважує головна редакторка "ТиКиїв" Ольга Безсонова.

Паралельно розвиваються й методи детекції. Ця технологічна "гонка озброєнь"  визначатиме майбутнє інформаційного простору.

Вміння розрізняти тексти ШІ та людські — це не просто корисна навичка. Це питання інформаційної гігієни та критичного мислення в еру, коли дезінформація й маніпуляції набувають нових форм.
Розуміння механізмів створення контенту допоможе кожному усвідомлювати цінність оригінального авторства та свідомо лавірувати в потоці інформації, — додає головна редакторка "Новини.LIVE" Олена Халік.

Штучний інтелект — беззаперечно неймовірно потужний інструмент сучасності. Але людська творчість, імпульсом якої є само життя, — цінність, яку варто берегти та плекати.

Читай також: 7 практик для покращення навичок написання текстів   

Знайшли помилку? Виділіть її та натисніть Ctrl+Enter

Може бути цікаво

Знайшли друкарську помилку?

Роботу над знаковим проєктом для виликого стримінгового сервісу не зупинила навіть війна.

Цей сайт використовує cookie-файли
Більше інформації