July 18, 2023

Хотел ничего не писать недельку, но тут внезапно (на самом деле очень ожидаемо) Meta выложила продолжение своей самой популярной большой текстовой модели — Llama 2-Chat. Эта модель примерно в 2 раза больше предыдущей LLaMA во всем (включая контекст), содержит разметку на базе пользовательской оценки диалогов, и самое главное — судя по всему, Мета собирается продавать право на использование этой модели в коммерческих проектах.

На деле и старую LLaMA, и построенные на ее базе открытые решения активно использовали в коммерческих проектах по всему миру. Так что тут появилась возможность легализации. Llama 2 пока выглядит чуть слабее, чем собственные решения гугла и OpenAI, однако для опенсорсного решения это нормально — зато вы сможете улучшать и изменять свою модель так, как хотите.

github.com/facebookresearch/llama

GitHub - facebookresearch/llama: Inference code for LLaMA models

Inference code for LLaMA models. Contribute to facebookresearch/llama development by creating an account on GitHub.