「法国版 OpenAI」Mistral AI获微软投资!微软,为何选中这家成立仅十个月的法国独角兽?

 

 

· 编译 · 梦姐 ·  

· Serena · 

 

 

 

原公众号文章地址:https://mp.weixin.qq.com/s/v7AQlSbWLaa4NhjSk_CjUQ

 

 

 

【雪球导读】

【News】「法国版 OpenAI」Mistral AI被微软收编。这家成立仅十个月的公司估值在微软投资前就已经达到20亿美元,被视为下一个最有可能与OpenAI竞争的人工智能企业。

 

SnowEngine

 

 

 

 

Part 1

 

Mistral AI&微软

 

 

 

生成式 AI 领域,又有重量级产品出现!!

 

周一晚间,被称为“法国版 OpenAI”的 Mistral AI 再放大招,正式发布 Mistral Large 旗舰模型,并且推出对标 ChatGPT 的对话产品:Le Chat,直接杀到 OpenAI 家门口。

 

就在 Mistral Large 发布前几个小时,全球市值第一的微软宣布与 Mistral AI 达成深度合作。未来,Mistral AI 可能将获得 OpenAI 同等待遇,直接将模型资源放在微软云当中售卖,成为第二家在微软 Azure 云平台上提供商业 AI 模型的公司。

 

据外媒 FT报道和雪球易创媒体部确认,微软收购了少数 Mistral AI 的股权,这意味着在投资 OpenAI 之后,Mistral AI 成为微软投资的第二家大模型公司。

 

(Mistral的大型语言模型将在微软的Azure云计算平台上提供)

 

试用链接:https://chat.mistral.ai/

 

 

目前,开发者可从以下渠道获取 Mistral AI:

 

La Plateforme:在欧洲的 Mistral 基础设施上安全托管,这个接入点使开发者能够在全面的模型范围内创建应用和服务。


微软Azure:Mistral Large 可以通过 Azure AI Studio 和 Azure Machine Learning 获得,用户体验与 API 一样。Beta 客户已经成功使用了它。


自我部署:Mistral Large 环境上部署,并且可以访问模型权重。

 

微软 Azure AI Studio  

 

Mistral Large 在 Azure AI 上的定价如下:输出为 0.024 美元 / 1000 token,输入为 0.008 美元 / 1000 token。相比之下,128K 上下文窗口的 GPT-4 Turbo 定价为:输出为 0.03 美元/1000 token,输入 0.01 美元/ 1000 token。

 

此外,Mistral AI 还还发布了首个对标 ChatGPT 的对话助手 Le Chat,该助手可以在后台使用 Mistral Large 或 Mistral Small,或者一个名为 Mistral Next 的原型模型;并发布了面向企业的 Le Chat Enterprise。

 

 

 

 

 

Part 2

 

Mistral Large 性能

 

 

Mistral Large 性能直逼 GPT-4

 

根据官方新闻稿介绍,Mistral Large是Mistral AI的最新旗舰版本,具备卓越的推理能力。它可用于执行复杂的多语言推理任务,包括文本理解、转换和代码生成。

 

在常见基准测试中,Mistral Large表现出色,以81.2%的得分超越了Claude 2、Gemini Pro、GPT-3.5、Llama 2-70B等四款模型,仅次于GPT-4。

 

在 MMLU(测量大规模多任务语言理解)上,GPT-4、Mistral Large(预训练)、Claude 2、Gemini Pro 1.0、GPT 3.5 和 LLaMA 2 70B的比较。

 

 

Mistral Large 具有以下特点:

 

Mistral Large在英语、法语、西班牙语、德语和意大利语方面具有天然的流利度,对语法和文化背景有细腻的理解。

 

其32K token的上下文窗口允许精确地从大型文档中回溯信息。

 

其精确的指令遵循能力使开发者能够设计他们的审核政策,例如,Mistral AI使用它来设置Le Chat的系统级审核。

 

此外,它天然具备函数调用能力。这一点,再加上在la Plateforme上实施的受限输出模式,使得应用开发和技术栈的现代化能够规模化进行。

 

与常用基准测试上的顶级LLM模型相比,Mistral Large也表现不俗。

 

 

市场上蕞优秀的LLM模型在广泛的常识、推理和知识基准测试中的表现包括:MMLU(衡量大规模多任务语言理解)、HellaSwag(10-shot)、Wino Grande(5-shot)、Arc Challenge(5-shot)、Arc Challenge(25-shot)、TriviaQA(55-shot)以及TruthfulQA。

 

 

Mistral Large在语言处理领域表现出色,尤其在法语、德语、西班牙语和意大利语的HellaSwag、Arc Challenge和MMLU基准测试中,其性能远远超越了LLaMA 2-70B。

 

 

在绝大多数基准测试中,Mistral 7B的性能均优于Llama 2 13B。举例而言,在语言能力方面,特别是在欧洲市场重要的多语言能力测试MMLU上,Mistral展现出明显的优势;而在推理能力方面,Mistral仅略逊于专门在代码场景训练的Code-Llama 7B。

 

 

 

Part 3

 

 微软牵手

Mistral AI

 

在这次合作中,Mistral AI的联合创始人兼首席执行官Arthur Mensch表示:“微软对我们模型的信任是我们将前沿人工智能交到每个人手中的旅程中迈出的重要一步。”

 

微软总裁Brad Smith在接受外媒CNBC采访时表示:“就微软对欧洲的技术支持而言,今天是最重要的日子之一。我们与Mistral AI建立长期合作伙伴关系,使他们能够在我们的人工智能数据中心、基础设施上进行下一代人工智能模型的训练和部署,并立即生效……对我们而言,重要的是要表明这不仅仅是微软的技术,也不仅仅是美国的产品。这也将成为欧洲技术、创新和增长的引擎。”

 

 

此次,微软与 Mistral AI 的合作重点关注三个核心领域: 

 

超级计算基础设施:微软将通过 Azure AI 超级计算基础设施来支持 Mistral AI,为 Mistral AI 旗舰模型的 AI 训练和推理工作负载提供一流的性能和规模。 

 

扩展到市场:微软和 Mistral AI 将通过Azure AI Studio和Azure 机器学习模型目录中的模型即服务 (MaaS) 向客户提供 Mistral AI 的高级模型。除了 OpenAI 模型之外,模型目录还提供开源和商业模型的多种选择。开发者可使用 Microsoft Azure 消费承诺 (MACC)来购买 Mistral AI 的模型。Azure 的 AI 优化基础设施和企业级功能为 Mistral AI 提供了向全球 Microsoft 客户推广、销售和分发其模型的额外机会。 

 

人工智能研究和开发:微软和 Mistral AI 将探索围绕为特定客户(包括欧洲公共部门工作负载)培训特定目的模型的合作。 

 

 

Mistral AI创始人Guillaume Lample在X上正式宣布Mistral Large后,图灵奖获得者、Meta首席科学家Yann LeCun(杨立昆)立即转变了他以往对OpenAI的苛刻态度,并第一时间发送祝贺。

 

 

 

 

Part 4

 

 Mistral AI成员

 

Mistral AI 联合创始人:Guillaume Lample、Arthur Mensch、Timothée Lacroix

 

 

Mistral AI是一家总部位于欧洲的大型语言模型(LLM)公司,其团队由来自Google、Meta和Hugging Face的新一代法国科学家组成。法国是欧洲AI人才最为聚集的地区,Falcon模型和Hugging Face社区均起源于法国团队。他们在多模态、检索增强生成(RAG)等大型模型创新领域积累了丰富经验,因此有理由期待Mistral AI的下一代新模型具有改变游戏规则的潜力。

 

尽管公司规模不大,但Mistral AI的目标是构建一个“世界级的团队”,并致力于建立开源模型,其使命是将公开可用的模型推向最先进的性能水平。联合创始人Arthur Mensch提出,Mistral AI旨在成为大型模型公司中最具成本效益的企业之一。

 

 

据Mistral AI介绍,该公司的大型模型在成本与性能之间取得了平衡,并且在推理速度方面表现出色,对内存需求较低,同时具有相对较高的吞吐量。

 

尽管目前公司最先进的模型Mistral-Large尚未开源,但根据Arthur Mensch的说法,找到商业模式和坚持开源价值观之间的平衡是一个微妙的任务。公司希望在创造新事物和新架构的同时,也能向客户提供一些额外的产品和服务。

 

Source:Retool State of AI Report

 

在企业使用大型语言模型(LLM)时,考虑因素不仅包括最先进的模型能力,还涵盖数据安全隐私、成本控制等多个方面。开源模型,对企业开放,更符合定制化和私有化使用的需求,而类似OpenAI等闭源模型公司则无法满足这种需求。未来LLM市场可能会呈现开源模型满足基本智能需求,而闭源模型满足更高级智能需求的趋势。随着模型的不断升级,开源模型能够满足的需求也将逐渐增多。

 

欧洲市场对Mistral AI来说既是机遇又是挑战。欧洲企业在采用新技术方面相对保守,数据监管严格,但支付能力强。这使得欧洲科学家更容易通过使用开源模型获得信任。对于以科学家为主的公司而言,进入市场的能力可能是他们的短板。

 

然而,开源模型的商业化尚未完全验证,公有云提供商同样具备服务开源模型并进入欧洲市场的能力。尤其是Mistral AI希望打造的是一个轻量级的LLM,企业在使用时不会面临很高的使用门槛。因此,Mistral AI当前最大的挑战不仅仅是训练出卓越的模型,还包括寻找关键的企业合作伙伴。

 

 

值得注意的是,近年来欧洲的创新和创业生态取得了一些进展,今年的独角兽数量已经超过了我们中国市场。

 

在未来,让我们期待Mistral AI能够找到解决文中提到的关键问题的方法,成为欧洲市场上的OpenAI,推动大型语言模型(LLM)技术的开放和实际应用。

 

 

参考资料:

https://mistral.ai/news/mistral-large/

https://techcommunity.microsoft.com/t5/ai-machine-learning-blog/mistral-large-mistral-ai-s-flagship-llm-debuts-on-azure-ai/ba-p/4066996

https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/

https://techcrunch.com/2024/02/26/mistral-ai-releases-new-model-to-rival-gpt-4-and-its-own-chat-assistant/

 

 

(注:部分截图来源于网络,侵删)

 

 

·雪球易创·

SnowEngine

 

 

雪球易创科技(SnowEngine)是全球领先的云计算和人工智能解决方案服务提供商,业务遍布全球60多个国家和地区。公司面向海内外企业提供微软365和云服务微软Azure、云战略咨询、云网资源、企业级云托管服务、海外TikTok代投、自研AI产品等一体化产品及解决方案。

 

 

关注我们 ,在AI赛道,能跑的更快一点~

 

 

行业资讯

我们是专业的云计算数据平台