​​Mistral AI запускает высокопроизводительную модель искусственного интеллекта и ча...

8 мес. назад 103

​​Mistral AI запускает высокопроизводительную модель искусственного интеллекта и чатбот, чтобы бросить вызов ChatGPT, Claude и Gemini

Парижский стартап Mistral AI выходит в высшую лигу, запуская Mistral Large, чтобы конкурировать с другими топовыми крупноязычными моделями, и представляя бета-версию "Le Chat", своего потребительского чатбота, призванного соперничать с лидером рынка Open AI - ChatGPT.

"Mistral Large - это наша флагманская модель, обладающая первоклассными способностями к рассуждениям, - говорится в официальном заявлении компании, - Mistral Large достигает высоких результатов в общепринятых бенчмарках, что делает ее второй в мире моделью, общедоступной через API (после GPT-4)".

Mistral Large поддерживает контекстное окно из 32 тысяч лексем, обычно более 20 тысяч слов на английском языке, и свободно владеет английским, французским, испанским, немецким и итальянским языками с тонким пониманием грамматики и культурного контекста для каждого из них. Стартап утверждает, что его флагманская модель "идеально подходит для сложных задач, требующих больших рассуждений или узкой специализации", и описывает свои результаты как "краткие, полезные, не вызывающие сомнений, с полностью модульным контролем модерации".

Mistral AI стал любимцем сообщества ИИ с открытым исходным кодом благодаря своим высокопроизводительным моделям, таким как Mistral 7B и топовая Mixtral 8x7B, в которой для повышения общего качества использовался подход "смесь экспертов". Однако Mistral Large является собственной моделью, поэтому техническая информация для независимого сравнения этой модели с конкурентами ограничена.

Компания не ответила на запрос Decrypt о предоставлении соответствующих технических документов или подробностей о количестве параметров обучения, методах обучения или даже корпусе данных, использованных для построения модели.

Чем же Mistral Large отличается от своих конкурентов, по крайней мере, по результатам тестов, проведенных ее создателем?

Mistral AI утверждает, что Mistral Large занимает второе место после GPT-4, основываясь на нескольких бенчмарках, но реальное использование может всегда отличаться. Mistral Large не тестировался в сторонних рейтингах, таких как Chatbot Arena, но Mistral AI утверждает, что он превзойдет Mistral Medium, который занял более высокое место, чем GPT-3.5, Claude1, Claude 2 и Qwen, основываясь на слепом сравнении результатов с аналогичными подсказками.

Mistral Large теперь доступен через платный API, и он намного дешевле, чем вариант OpenAI. Mistral Large стоит 8 долларов за миллион токенов ввода и 24 доллара за миллион токенов вывода (столько же, сколько и Claude), в то время как GPT-4 стоит 10 и 30 долларов соответственно.

Le Chat, чат-ассистент Mistral AI, пока доступен бесплатно в качестве бета-продукта, и пользователи могут выбирать между тремя различными моделями: Mistral Small, Mistral Large и прототип под названием Mistral Next, предназначенный для краткого и лаконичного общения.

Компания также планирует запустить платную версию Le Chat для корпоративных клиентов, включая централизованный биллинг и возможность определять механизмы модерации.

Decrypt смог протестировать возможности генерации и обнаружил, что чатбот прошел цензуру, выглядел достаточно компетентным, не вызывал чрезмерных галлюцинаций, имел прогрессивный, но уважительный тон и понимал длинные контекстные подсказки. Однако чатбот не является мультимодальным и не может получать доступ к информации в реальном времени через веб-поиск.

Основанная выпускниками Google DeepMind и Meta, компания Mistral AI быстро выделилась в секторе искусственного интеллекта. Уже через несколько месяцев после регистрации в мае 2023 года компания привлекла значительный капитал, включая раунд финансирования в размере 415 миллионов долларов под руководством Andreessen Horowitz. Изначально компания придерживалась принципов открытого исходного кода, но затем перешла к бизнес-модели, схожей с OpenAI: Mistral Large предлагается через платный API.

@neurocrypto

Читать полностью в источнике