North Mini Code – Cohere 开源的 Agentic 编码模型
North Mini Code是什么
North Mini Code 是 Cohere 开源的 Agentic 编码模型。模型采用 MoE 架构,总参数 30B、激活仅 3B,支持 256K 上下文与 64K 输出。模型专为代码生成与软件工程任务优化,在 Artificial Analysis Coding Index 获 33.4 分,API 输出速度约 199 tokens/秒,最低可在单张 H100 上本地部署。

North Mini Code的主要功能
-
代码生成:模型支持科学计算与算法推理的复杂代码生成任务。
-
Agentic 软件工程:可在 SWE-Agent、OpenCode 等框架中执行仓库级代码修改。
-
终端代理:端到端驱动 Shell 工具完成多轮构建与部署任务。
-
本地编码:3B 激活参数支持低延迟本地推理,适合隐私敏感场景。
- 子代理编排:理解系统架构并协调子代理完成代码审查与重构。
North Mini Code的技术原理
-
MoE 稀疏激活:模型30B 总参数中仅路由激活 3B,显著降低推理成本与显存占用。
-
超长上下文:256K 输入上下文支持一次性载入中型代码库,64K 输出可生成完整模块。
-
Agentic 训练:针对 SWE-Agent、ReAct 终端工具链等多框架训练,泛化于不同 Agent 脚手架。
- 速度优化:在同等并发与硬件下,输出吞吐比 Devstral Small 2 高 2.8 倍,token 间延迟低 30%。
如何使用North Mini Code
-
Hugging Face 下载权重:获取开源权重并通过兼容框架本地部署。
-
Cohere API 调用:用 Chat V2 API,免费额度内零成本试用。
-
Model Vault 托管:企业用户可在 Cohere 托管推理平台一键部署生产环境。
-
OpenCode 集成:在 OpenCode 平台直接选用
north-mini-code-free模型免费体验。
North Mini Code的核心优势
-
高效低成本:模型3B 激活参数使推理成本远低于同性能密集模型。
-
企业合规友好:支持本地、VPC 或私有云部署,满足金融等行业的数据不出域要求。
-
长窗口优势:256K/64K 的上下文与输出长度适合大代码库分析与批量生成。
-
多框架兼容:原生适配 OpenCode,同时兼容主流 Coding Agent 脚手架。
North Mini Code的项目地址
- 项目官网:https://docs.cohere.com/docs/north-mini-code-1.0
- HuggingFace模型库:https://huggingface.co/blog/CohereLabs/introducing-north-mini-code
North Mini Code的同类竞品对比
| 维度 | North Mini Code | Devstral Small 2 |
|---|---|---|
| 架构 | MoE(30B / 3B) | 密集模型 |
| 输出吞吐 | 高 2.8 倍 | 基准 |
| Token 间延迟 | 低 30% | 基准 |
| 最大上下文 | 256K | 较短 |
| 最大输出 | 64K | 较短 |
| 开源协议 | Apache 2.0 | 视版本而定 |
| 定位 | Agentic 代码 + 终端任务 | 通用代码辅助 |
North Mini Code的应用场景
-
企业私有代码助手:模型支持本地或 VPC 部署,满足金融、医疗等行业核心代码不出域的合规要求。
-
仓库级重构:256K 上下文窗口可一次性载入中型代码库,执行跨文件依赖分析与批量重构。
-
终端自动化流水线:通过 SWE-Agent 等框架驱动 Shell 工具链,完成自动化构建、测试与部署任务。
-
科学计算辅助:为研究人员生成算法实现、数据处理脚本及复杂数学推理代码。
-
IDE 实时插件:3B 激活参数支持低延迟推理,适合嵌入编辑器提供实时代码补全与智能建议。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。
粤公网安备 123456789号