MistralAI发布多模态新模型MistralAI新模型1/8成本比肩Clau

MistralAI发布多模态新模型MistralAI新模型1/8成本比肩Claude3.7

用1/8成本比肩Claude 3.7，刚刚，“欧洲OpenAI”Mistral AI发布多模态新模型。

Mistral Medium 3，主打编程和多模态理解，且在性能和成本间进行了平衡。【图1】

官方称，在各类基准测试中，Mistral Medium 3性能达到或超越Claude Sonnet 3.7的90%，且成本大大降低。

Claude 3.7 Sonnet的价格为每百万输入token 3美元，每百万输出token 15美元，而Mistral Medium 3

每百万个输入token仅0.4美元，每百万个输出token 2美元。

整体性能，不管是和领先开源模型Llama 4 Maverick还是和企业级模型Cohere Command A相比，Mistral Medium 3都能打得有来有回。

目前，Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上线，不久后还将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

一、具备一系列企业级能力

下面具体来看看基准测试。

Mistral Medium 3在编程和STEM任务中尤为突出。【图2】

官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

不过呢，既不开放模型权重，也没有透露模型大小……【图3】

另外，Mistral AI还发布了第三方人类评估。

人类评估中，Mistral Medium 3依旧是在编程方面占优势。【图4】

在多模态和其他人语言任务中，相比Llama 4 Maverick，Mistral Medium 3的表现也占上风。【图5】

除了测试数据之外，官方还特别强调了其适应企业环境的能力，包括：

* 混合部署或本地 / 虚拟私有云（VPC）内部署

* 定制化后期训练

* 与企业工具和系统集成

企业可以轻松将智能全面集成到系统中，借助Mistral的应用AI解决方案，该模型可以持续进行预训练、全面微调，并融入企业知识库，使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

官方称，金融服务、能源和医疗保健领域的客户正在使用该模型测试，通过深入的背景信息来丰富客户服务、实现业务流程的个性化，并对复杂的数据集进行分析。【图6】

另外，他们还推出了Le Chat Enterprise，这是一项面向企业的聊天机器人服务，提供了AI Agent建造器之类的工具，并将Mistral的模型与Gmail、Google Drive、SharePoint等第三方服务集成。

据了解，Le Chat Enterprise将很快支持 MCP。

Mistral Medium 3发布后引发大批网友关注，有网友为其“高性价比”点赞。【图7】

不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较，有点奇怪。【图8】

还有行动派网友，想看什么自己比较。

StabilityAI创始人翻出了Gemini 2.5 Flash的基准测试结果：【图9】

看后表示：【图10】

>与Gemini 2.5 Flash竞争是多么困难，Gemini 2.5 Flash成本比Mistral Medium 3低70%。

>期待开源模型的发布，这是Mistral的关键优势。

二、One More Thing

继三月份推出Mistral Small、今日推出Mistral Medium后，Mistral AI透露接下来几周正着手开发“大型”项目。【图11】

0 阅读：0