February 15, 2019

Вчера разработчики OpenAI (они мне прям глубоко симпатичны последние 2 года) показали работу своей новой сети, которая по сути пишет тексты статей. Тоесть вы пишете заголовок, а текст статьи уже можно отдать на откуп AI, и он читается как нормальный. Полистайте примеры и вообще почитайте, очень интересная работа. Но меня удивило не это.

Обычно OpenAI очень открытые и выкладыавют все свои исходные тексты и датасеты, чтобы вы могли воспроизвести бОльшую часть результата у себя. В данном случае они решили НЕ выкладывать датасет, потому что “опасаются неправильного использования” этих данных. И это очень правильный и ответственный шаг, я бы поступил так же. blog.openai.com/better-language-models/

Better Language Models and Their Implications

We’ve trained a large-scale unsupervised language model which generates coherent paragraphs of text, achieves state-of-the-art performance on many language modeling benchmarks, and performs rudimentary reading comprehension, machine translation, question answering, and summarization.