Хотел ничего не писать недельку, но тут внезапно (на самом деле очень ожидаемо) Meta выложила продолжение своей самой популярной большой текстовой модели — Llama 2-Chat. Эта модель примерно в 2 раза больше предыдущей LLaMA во всем (включая контекст), содержит разметку на базе пользовательской оценки диалогов, и самое главное — судя по всему, Мета собирается продавать право на использование этой модели в коммерческих проектах.
На деле и старую LLaMA, и построенные на ее базе открытые решения активно использовали в коммерческих проектах по всему миру. Так что тут появилась возможность легализации. Llama 2 пока выглядит чуть слабее, чем собственные решения гугла и OpenAI, однако для опенсорсного решения это нормально — зато вы сможете улучшать и изменять свою модель так, как хотите.
github.com/facebookresearch/llam
GitHub - facebookresearch/llama: Inference code for LLaMA models
Inference code for LLaMA models. Contribute to facebookresearch/llama development by creating an account on GitHub.