如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-18 00:50:11

卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先***地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的MiniMax-Text-01模型上增量训练得来的,结构跟MiniMax-Text-01模型一致,MoE结构,总参数456B,激活参数45.9B。

Paper:***s://github***/MiniMax-AI/MiniMax-M1/blob/main/…。

如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
广告位810*200
相关阅读
为什么山姆这么受欢迎?

为什么山姆这么受欢迎?

2024年初去哈佛访问,在美国呆了大半年。 期间没事就出去...

2025-06-22
如何评价前端框架 Solid?

如何评价前端框架 Solid?

Solid 很灵活。 它没有和 Web 绑死,没有和特殊的编...

2025-06-22
穿瑜伽裤爬山的女生会不会害羞?

穿瑜伽裤爬山的女生会不会害羞?

上个月去爬太室山,前面就有个瑜伽裤女生,一个人,本来我按我的...

2025-06-22
美军 B-2 轰炸机参与袭击伊朗核设施,B-2轰炸机战斗力如何?会摧毁伊朗核设施吗?

美军 B-2 轰炸机参与袭击伊朗核设施,B-2轰炸机战斗力如何?会摧毁伊朗核设施吗?

B-2 轰炸机的战斗力主要体现在核能力,对付伊朗是明显过剩的...

2025-06-22
如何评价阿富汗取消与中国的石油开***合同?

如何评价阿富汗取消与中国的石油开***合同?

本次的阿富汗***,包括近期的尼日尔***,其实都反映了一类...

2025-06-22