OpenAI создали алгоритм, генерирующий осмысленные тексты

18 февраля 2019
Фото аватара
18.02.2019
2211
1 минута на чтение
OpenAI создали алгоритм, генерирующий осмысленные тексты

OpenAI — некоммерческая исследовательская компания, которая занимается вопросами искусственного интеллекта, распознавания образов и тренировкой нейросетей. Её сформировали ещё в 2015 году, причём одним из основателей был предприниматель Илон Маск. С тех пор команда исследователей несколько раз демонстрировала любопытные результаты в области изучения ИИ — например, в 2017-м бот OpenAI победил сильнейших игроков в Dota2.

Команда учёных под руководством Алека Рэдфорда (Alec Radford) создала алгоритм GPT-2, который научился генерировать осмысленные тексты — на основе уже прочитанного материала. Исследователи собрали базу данных WebText из 40 гигабайт с восьми миллионов страниц в интернете. Авторы опирались не только на новостные заметки, а на самые разные материалы, в том числе и на заметки с Reddit. Программа рассматривала посты, собравшие больше трёх «плюсов».

После того, как обучение было завершено, исследователи обнаружили, что алгоритму можно «скормить» небольшой отрывок текста, а на выходе получить материал, основанный на первоначальной идее.

Вот такой текст показали алгоритму в одном из примеров:

Шокирующая находка — учёные нашли стадо единорогов, обитающих в удалённой, ранее не исследованной долине в Андах. Ещё большей неожиданностью стало то, что единороги разговаривают на идеальном английском.

GPT-2 сгенерировал девять абзацев. Мы перевели первые три:

Учёные назвали эту популяцию в честь выдающегося рога — единороги Овида. Эти четверорогие серебристо-белые единороги ранее не были известны науке.

Теперь, спустя почти два века, загадка возникновения этого удивительного феномена наконец-то разрешена.

Доктор Хорге Перетц, биолог-эволюционист из университета Ла-Пас, вместе с несколькими компаньонами занимались исследованием Анд, когда они обнаружили небольшую долину, где не было животных или людей. Перетц заметил нечто похожее на естественный фонтан, окружённый двумя скалистыми пиками и серебристым снегом.

Исследователи не выложили программный код обученной модели целиком, поскольку они боятся «недобросовестного использования». Вместо этого они опубликовали лишь упрощённую модель и описали проделанную работу в статье.

Статьи

Читаем книгу «Время пепла» Дэниела Абрахама
0
8433
Читаем книгу «Время пепла» Дэниела Абрахама

Пролог, где описывается один день из жизни города и появляется главная героиня, Алис.

Сериал Fallout: абсолютная экранизация (для тех, кто любит игры от Bethesda) 3
0
52308
Сериал Fallout: абсолютная экранизация (для тех, кто любит игры от Bethesda)

Есть ли к чему придраться, или всё идеально? Пробуем разобраться.

Мария Семёнова «Братья. Книга 3: Завтрашний царь. Том 1». Конец ещё не виден
0
58549
Мария Семёнова «Братья. Книга 3: Завтрашний царь. Том 1». Конец ещё не виден

Славянское фэнтези для матёрых фанатов

Alone in the Dark: запутанное дело спорного перезапуска 34
0
107503
Alone in the Dark: запутанное дело спорного перезапуска

Увлекательный сюжет и затягивающая густая атмосфера нивелируются посредственным техническим исполнением.

«Мир без Стругацких: Межавторская антология». Если бы АБС не было
0
153842
«Мир без Стругацких: Межавторская антология». Если бы АБС не было

Собрание альтернативной литературы

«Падение империи»: политический хоррор из недалёкого будущего
0
156918
«Падение империи»: политический хоррор из недалёкого будущего

Америку раздирает вражда, журналистов убивают, а люди принимают ужасы войны за «фейк ньюс».

Художница Полина Граф: книжные обложки, яркие персонажи и мир фэнтезийной космооперы 9
0
248056
Художница Полина Граф: книжные обложки, яркие персонажи и мир фэнтезийной космооперы

Российская художница — о трудностях создания обложек, любви к писательству и уникальном стиле

«Дева и дракон»: история о том, как одна принцесса сама себя спасала 3
0
212368
«Дева и дракон»: история о том, как одна принцесса сама себя спасала

Ещё одна попытка деконструировать троп «дамы в беде»

Спецпроекты

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: