开源AI领域的新突破:Mistral AI的Miqu-1-70b模型

近日,巴黎AI公司Mistral的一款名为‘Miqu-1-70b’的模型引起了广泛关注,因其潜在的性能可能与广受好评的GPT-4相匹敌甚至超越。让深入了解这一事件及其对开源AI格局的影响。

Mistral AI推出Mixtral 8x7B:强大的稀疏专家混合模型

故事始于一个名为“Miqu Dev”的用户在HuggingFace这个著名的开源AI平台上上传了文件,展示了一个名为‘Miqu-1-70b’的新的大型语言模型(LLM)。人们开始猜测它与Mistral的关系,以及其潜在的性能是否可与GPT-4相媲美。

‘Miqu-1-70b’的神秘出现

AI社区,包括X、LinkedIn和4chan等平台,迅速行动起来,分析泄露模型的影响。讨论包括“Miqu”是否是Mistral模型的量化版本,引发了关于内部泄露或员工或客户不当行为的问题。

Mistral的CEO确认泄露

Mistral的CEO Arthur Mensch在X上结束了猜测,确认了意外的泄露。他透露,一个来自早期访问客户的热心员工泄露了一个量化和加水印的旧Mistral模型的版本,该模型是从Meta的Llama 2重新训练的。Mensch还暗示了公司的进步,暗示他们即将发布一个可以与GPT-4竞争甚至超越的模型。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485