OpenAI создали алгоритм, генерирующий осмысленные тексты

18 февраля 2019
Фото аватара
18.02.2019
2229
1 минута на чтение
OpenAI создали алгоритм, генерирующий осмысленные тексты

OpenAI — некоммерческая исследовательская компания, которая занимается вопросами искусственного интеллекта, распознавания образов и тренировкой нейросетей. Её сформировали ещё в 2015 году, причём одним из основателей был предприниматель Илон Маск. С тех пор команда исследователей несколько раз демонстрировала любопытные результаты в области изучения ИИ — например, в 2017-м бот OpenAI победил сильнейших игроков в Dota2.

Команда учёных под руководством Алека Рэдфорда (Alec Radford) создала алгоритм GPT-2, который научился генерировать осмысленные тексты — на основе уже прочитанного материала. Исследователи собрали базу данных WebText из 40 гигабайт с восьми миллионов страниц в интернете. Авторы опирались не только на новостные заметки, а на самые разные материалы, в том числе и на заметки с Reddit. Программа рассматривала посты, собравшие больше трёх «плюсов».

После того, как обучение было завершено, исследователи обнаружили, что алгоритму можно «скормить» небольшой отрывок текста, а на выходе получить материал, основанный на первоначальной идее.

Вот такой текст показали алгоритму в одном из примеров:

Шокирующая находка — учёные нашли стадо единорогов, обитающих в удалённой, ранее не исследованной долине в Андах. Ещё большей неожиданностью стало то, что единороги разговаривают на идеальном английском.

GPT-2 сгенерировал девять абзацев. Мы перевели первые три:

Учёные назвали эту популяцию в честь выдающегося рога — единороги Овида. Эти четверорогие серебристо-белые единороги ранее не были известны науке.

Теперь, спустя почти два века, загадка возникновения этого удивительного феномена наконец-то разрешена.

Доктор Хорге Перетц, биолог-эволюционист из университета Ла-Пас, вместе с несколькими компаньонами занимались исследованием Анд, когда они обнаружили небольшую долину, где не было животных или людей. Перетц заметил нечто похожее на естественный фонтан, окружённый двумя скалистыми пиками и серебристым снегом.

Исследователи не выложили программный код обученной модели целиком, поскольку они боятся «недобросовестного использования». Вместо этого они опубликовали лишь упрощённую модель и описали проделанную работу в статье.

Статьи

Какие фильмы смотреть в мае 2024 онлайн и за границей? Конец света наступает! 4
0
30961
Какие фильмы смотреть в мае 2024 онлайн и за границей? Конец света наступает!

Бензак пылает, аква-кола кипит, Дженнифер Лопес против роботов, Дэдпул против горящей зефирины с глазами.

Джим Батчер «Поле боя». Магическая битва в Чикаго
0
36965
Джим Батчер «Поле боя». Магическая битва в Чикаго

Самый свежий роман о Гарри Дрездене

Какие фильмы смотреть в мае 2024 в России? Товарищ Майор, паводки, коррупция и тираны 3
0
81939
Какие фильмы смотреть в мае 2024 в России? Товарищ Майор, наводнение, кибер-заговор и тираны против пацанов

Британия утонет, клоун из «Оно» набьёт всем морды, а андроиды раскроют межпланетный заговор.

Non/fiction весна 2024: главные события и книги выставки 11
0
137330
Non/fiction весна 2024: главные события и книги выставки

Встречи с авторами, лекции и презентации.

Художник Юрий Хилл: 7
0
224355
Художник Юрий Хилл: мрачные миры, лесные чудовища и невыразимый ужас

Беседа об эмоциях, которые дарит хоррор, картинах Шишкина и о том, как стать богатым и знаменитым офисным сотрудником

Сериал Fallout: а это точно было в играх? 5
0
177848
Сериал Fallout: а это точно было в играх?

Совпадения и различия вселенной сериала и канона игр

Тёмная сторона Вселенной: что такое тёмная материя и как ее найти 5
0
229388
Тёмная сторона Вселенной: что такое тёмная материя и как ее найти

Как изучают мрак, из которого состоит вселенная

«Чужой» среди своих: лучшие кроссоверы с участием ксеноморфов 12
0
263377
Чужой против Терминатора, Баффи и Черепашек-ниндзя: самые безумные кроссоверы

Как будто кто-то сомневался, что ксеноморф может драться вообще с кем угодно

Спецпроекты

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: