Стартап Galileo Technologies в области искусственного интеллекта ставит Claude 3.5 Sonnet, Gemini от Google и Qwen2-72B-Instruct от Alibaba на первые места в рейтинге индекса галлюцинаций.

Стартап Galileo Technologies, занимающийся разработкой искусственного интеллекта, высоко оценил средние и открытые языковые модели большого размера в новом сравнительном тесте Hallucination Index. Тест, оценивающий 22 ведущие модели генеративного ИИ, измерял их точность в трех наборах задач. Рейтинг возглавил Claude 3.5 Sonnet от Anthropic, а Gemini 1.5 Flash от Google показал лучшие результаты по соотношению цена/качество. Qwen2-72B-Instruct от Alibaba оказалась самой эффективной моделью с открытым исходным кодом.

July 29, 2024
3 Статьи

Дополнительное чтение