March 08, 13:10

Обновилась статистика на чатбот-арене, можно посмотреть, какие LLM лидируют. Предсказуемо, на первом месте GPT4. Обещания Claude о том, что они новый лидер, не помогли, только третье место.

Как работает чатбот-арена: люди вводят свой промпт, показывается 2-3 варианта ответа от разных моделей, и пользователь выбирает, какой ответ лучше. После многих тысяч таких голосований на основании статистики строится лидерборд.

huggingface.co/spaces/lmsys/chatbot-arena-leaderboard