Хотел ничего не писать недельку, но тут внезапно (на самом деле…

July 18, 2023

Хотел ничего не писать недельку, но тут внезапно (на самом деле очень ожидаемо) Meta выложила продолжение своей самой популярной большой текстовой модели — Llama 2-Chat. Эта модель примерно в 2 раза больше предыдущей LLaMA во всем (включая контекст), содержит разметку на базе пользовательской оценки диалогов, и самое главное — судя по всему, Мета собирается продавать право на использование этой модели в коммерческих проектах.

На деле и старую LLaMA, и построенные на ее базе открытые решения активно использовали в коммерческих проектах по всему миру. Так что тут появилась возможность легализации. Llama 2 пока выглядит чуть слабее, чем собственные решения гугла и OpenAI, однако для опенсорсного решения это нормально — зато вы сможете улучшать и изменять свою модель так, как хотите.

github.com/facebookresearch/llama

GitHub - facebookresearch/llama: Inference code for LLaMA models
Inference code for LLaMA models. Contribute to facebookresearch/llama development by creating an account on GitHub.