Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

AI框架 2026-02-16

Qwen3.5是什么

Qwen3.5是阿里巴巴通义千问团队正式发布并开源的新一代原生多模态大模型。首发开源版本Qwen3.5-397B-A17B采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,总参数达3970亿但每次推理仅激活170亿参数,实现”以小胜大”——性能超越万亿参数的Qwen3-Max,部署显存降低60%,推理吞吐量最高提升至19倍。作为原生视觉-语言模型,通过早期文本-视觉融合与M-RoPE、3D位置编码技术,统一处理文本、图像、视频任务,语言支持从119种扩展至201种。在多项权威评测中,Qwen3.5在MMLU-Pro得分87.8超越GPT-5.2,GPQA得分88.4高于Claude 4.5,IFBench指令遵循评分76.5刷新历史纪录。API定价每百万Token仅0.8元,为Gemini 3 Pro的1/18,开发者可通过魔搭社区、HuggingFace或阿里云百炼获取模型权重与接口。

Qwen3.5

Qwen3.5的主要功能

  • 原生多模态理解:统一处理文本、图像、视频,通过早期视觉-语言融合实现跨模态推理。
  • 智能体能力:支持工具调用、任务规划与执行,在BFCL-V4等Agent评测中表现优异。
  • 高效推理架构:采用Gated DeltaNet+MoE混合设计,397B参数仅激活17B即可达到顶级性能。
  • 长上下文处理:支持最高1M上下文长度,256K场景下解码吞吐量是前代的19倍。
  • 多语言支持:覆盖201种语言与方言,词表扩展至25万,编码效率提升10-60%。
  • 代码生成:具备强大的编程能力,支持多语言代码编写、调试与复杂项目开发。
  • 视觉识别:细粒度图像理解、目标检测、OCR文档解析与空间关系推理。
  • 搜索增强:集成BrowseComp等搜索Agent能力,实现联网信息检索与整合。

Qwen3.5的技术原理

  • 混合注意力架构:融合Gated DeltaNet线性注意力与Gated Attention稀疏注意力,实现自适应计算资源分配。
  • MoE稀疏激活:总参数397B仅激活17B(约4.3%),通过1个共享专家+512个路由专家(每次激活10个)降低推理成本。
  • 门控机制优化:采用head-specific sigmoid门控替代传统softmax注意力,该成果获2025年NeurIPS最佳论文奖。
  • 原生多模态融合:利用M-RoPE和3D位置编码将时空信息原生嵌入LLM,实现视觉-语言早期融合。
  • 异构训练框架:视觉与语言组件解耦并行策略,稀疏激活实现跨模块计算重叠,训练吞吐接近纯文本基线。
  • FP8混合精度:原生FP8流水线对激活、MoE路由与GEMM采用低精度,敏感层保持BF16,显存降低50%以上。
  • 异步强化学习:构建可扩展异步RL框架支持全尺寸模型,实现训推分离与动态负载均衡,端到端加速3-5倍。
Qwen3.5

Qwen3.5的项目地址

  • Hugging Face模型库:https://huggingface.co/collections/Qwen/qwen35
  • GitHub仓库:https://github.com/QwenLM/Qwen3.5

如何使用Qwen3.5

  • 网页端体验:访问 Qwen Chat 或下载千问APP/PC客户端,直接输入文字或上传图片/视频进行多模态交互。
  • API调用:通过阿里云百炼平台获取API密钥,以每百万Token 0.8元的低价接入模型服务。
  • 本地部署:从HuggingFace或魔搭社区下载开源权重 Qwen3.5-397B-A17B,在本地或私有云环境部署运行。
  • 智能体开发:利用模型原生Agent能力,结合工具调用接口开发自动化任务执行、数据分析等应用。
  • 多语言应用:直接输入201种支持语言中的任意一种进行对话,无需额外配置翻译模块。
  • 长文档处理:上传超长文本、PDF或视频,模型自动处理最高1M上下文的复杂推理任务。

Qwen3.5的模型定价

  • 输入价格:每百万Token仅需0.8元,为全球顶级模型中最低价位之一
  • 价格对比:仅为Gemini 3 Pro的1/18,GPT-5.2的1/15,性价比优势显著
  • 开源免费:Qwen3.5-397B-A17B模型权重完全开源,开发者可免费下载本地部署

Qwen3.5的应用场景

  • 智能客服:支持201种语言的多轮对话与复杂问题解答,适用于全球化企业客服系统。
  • 内容创作:辅助文案撰写、视频脚本生成、多语言翻译与本地化内容适配。
  • 代码开发:提供代码生成、调试、重构服务,支持复杂软件项目开发与维护。
  • 视觉分析:实现图像识别、文档OCR、视频内容理解与细粒度视觉问答。
  • 智能体自动化:构建自动化工作流,执行数据分析、信息检索、任务调度等Agent任务。
  • 教育辅助:支持多语言教学、作业批改、个性化学习路径规划与知识问答。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章