Фейсбук выложил в открытый доступ построенный массив векторов fastText для 30 популярных языков. По моим оценкам на тренировку одного языка вроде русского с 300 измерениями у меня уходило 2 недели машинного времени. В общем это очень-очень щедрый подарок для всех, кто работает с сущностями языка и строит сервисы, понимающие людей. И да, опять же, по моим замерам fastText интереснее предыдущего фаворита, word2vec, хотя концепция почти та же. github.com/facebookresearch/fast