近日,巴黎AI公司Mistral的一款名为‘Miqu-1-70b’的模型引起了广泛关注,因其潜在的性能可能与广受好评的GPT-4相匹敌甚至超越。让深入了解这一事件及其对开源AI格局的影响。
故事始于一个名为“Miqu Dev”的用户在HuggingFace这个著名的开源AI平台上上传了文件,展示了一个名为‘Miqu-1-70b’的新的大型语言模型(LLM)。人们开始猜测它与Mistral的关系,以及其潜在的性能是否可与GPT-4相媲美。
AI社区,包括X、LinkedIn和4chan等平台,迅速行动起来,分析泄露模型的影响。讨论包括“Miqu”是否是Mistral模型的量化版本,引发了关于内部泄露或员工或客户不当行为的问题。
Mistral的CEO Arthur Mensch在X上结束了猜测,确认了意外的泄露。他透露,一个来自早期访问客户的热心员工泄露了一个量化和加水印的旧Mistral模型的版本,该模型是从Meta的Llama 2重新训练的。Mensch还暗示了公司的进步,暗示他们即将发布一个可以与GPT-4竞争甚至超越的模型。