2024年12月26日DeepSeek-V3 发布:671B 参数 MoE 架构深度求索发布 DeepSeek-V3,采用 MoE 架构,总参数 671B,激活参数 37B,训练成本仅 557 万美元。阅读更多 →