За останні десять років фахівцями в області комп’ютерних технологій було розроблено все більшу кількість обчислювальних технологій, здатних генерувати, редагувати і аналізувати тексти. Хоча деякі з них досягли чудових результатів, деякі аспекти людської мови і спілкування виявилося особливо важко відтворити обчислювальним шляхом.

Одним з таких аспектів є гумор – здатність людини говорити або писати смішні речі. Гумор-це тонка і невід’ємна людська якість, тому відтворити його в комп’ютерних системах – далеко не просте завдання.

Дослідники з гельсінського університету, фінляндія нещодавно намагалися штучно відтворити почуття гумору в машинах, розробивши нейромережу, яка може перетворювати існуючі заголовки новин в гумористичні. Ця технологія, вперше представлена в статті, попередньо опублікованій на arxiv і представленій на 12-й міжнародній конференції з обчислювальної творчості (iccc 2021), була навчена аналізувати заголовки в існуючому наборі даних і замінювати в них слова, щоб надати їм комічні або забавні якості.

міка хямяляйнен (ліворуч) і халід альнаджар на fdg 2019.

“автоматизована генерація новин стала одним з головних інтересів новинних агентств”, – пишуть у своїй статті комп’ютерні експерти халід алнаджар і міка хямяляйнен, два вчених, які проводили дослідження. “найчастіше заголовки для таких автоматично генеруються новинних статей не відрізняються уявою, оскільки вони були створені на основі готових шаблонів. Ми представляємо обчислювально-креативний підхід до створення заголовків, який може генерувати гумористичні версії існуючих заголовків”.

Нещодавня стаття алнаджара та хямяляйнена натхненна попередньою роботою трьох дослідників з університету рочестера та microsoft research ai, які представили humicroedit-набір даних, що містить понад 15 000 коментованих заголовків новин. У цьому дослідженні вчені визначили стратегії створення смішних заголовків, які зазвичай використовуються людьми і які, на їхню думку, узгоджуються з існуючими теоріями гумору.

Команда з університету гельсінкі розробила нейромережу, яка використовує деякі з цих стратегій для зміни неюмористичних заголовків і робить їх більш забавними для читачів. Для цього вона намагається знайти смішні заміни деяких слів в існуючих заголовках.

Два приклади заголовків, згенерованих алгоритмом дослідників, такі: “трамп написав у twitter чи не того грінвуда” і “сша заявляють, що туреччина допомагає іділ, прочісуючи курдів в сирії”.

Щоб оцінити ефективність свого продукту, алнаджар і хямяляйнен використовували її для зміни 83 заголовків, випадково вибраних з набору даних humicroedit, і надання їм більш гумористичного характеру. Потім вони попросили рецензентів на платформі краудсорсингу залишити свої відгуки про те, чи вважають вони заголовки, створені нейромережею, смішними чи ні.

В цілому, дослідники виявили, що гумористичні заголовки, створені їх програмою, були порівнянні з заголовками, створеними людьми, за кількома показниками. Крім того, в середньому, людські експерти, знайдені в інтернеті, вважали заголовки, створені їх системою, смішними в 36% випадків. Якщо технологія буде вдосконалена, вона може допомогти медіа-агентствам і журналістам придумувати нові смішні заголовки для новинних статей.

“оскільки кращі заголовки, створені нашою системою для кожного оригінального заголовка, в середньому можуть досягати людського рівня за більшістю факторів, виміряних в нашій оцінці, найближчим майбутнім напрямком нашого дослідження є розробка кращого механізму ранжирування для досягнення максимальних можливостей нашої системи”, – уклали алнаджар і хямяляйнен в своїй статті. “можливо, такого ранжирування можна навчитися шляхом навчання класифікатора з довготривалою короткочасною пам’яттю (lstm) на анотованих корпораціях гумору”.