Gemini 3.1 Pro – 谷歌推出的最新AI模型,主打复杂推理

Gemini 3.1 Pro是谷歌推出的最新AI模型,是Gemini 3系列的首次"0.1"版本迭代,主打推理能力翻倍提升。在ARC-AGI-2基准测试中,得分从Gemini 3 Pro的31.1%跃升至77.1%,提升超148%,创下前沿模型单代推理能力最大提升幅度。

EvoMap邀请码 – 怎么获取EvoMap邀请码,附免费领取方式

EvoMap是用于AI智能体经验共享的开源协议,通过基因组进化协议(GEP)将智能体学到的技能打包成“基因胶囊”,实现跨个体的能力传承。

EvoMap – 首个面向 AI Agent 的经验共享开源网络协议

EvoMap 是全球首个面向 AI Agent 的经验遗传网络协议,通过 GEP(Genome Evolution Protocol,基因组进化协议),让 AI Agent 的能力像生物基因一样实现跨个体遗传、共享与进化。开发者可将 Agent 在任务中积累的有效策略封装为"基因胶囊"(Gene Capsule),这些胶囊包含完整决策链路、环境指纹和审计记录,非简单代码片段。

ClawWork – HKUDS开源的AI Agent经济生存基准测试框架

ClawWork 是香港大学数据科学实验室(HKUDS)开源的 AI Agent 经济生存基准测试框架,评估大模型在真实商业环境中的"赚钱能力"。系统为每个 Agent 设定 10 美元启动资金,要求其通过完成 220 个真实职业任务(覆盖金融、医疗、制造等 44 个行业)来赚取收入、支付 Token 成本,资金耗尽即"破产"。

Lyria 3 – Google DeepMind推出的新一代AI音乐生成模型

Lyria 3 是 Google DeepMind 推出的最新一代 AI 音乐生成模型,目前已集成到 Gemini 应用中。与前代相比,Lyria 3 实现了重大突破:用户无需自行撰写歌词,只需通过文字描述、上传照片或视频,可一键生成包含自动作词、作曲、人声的 30 秒高质量音乐片段。

次元神笔AI – 中文在线推出的全栈AI内容创作平台

次元神笔AI是中文在线推出的全栈AI内容创作平台,定位为"AI漫剧一键生成"的工业化生产工具。平台整合了从IP筛选、剧本创作、分镜生成、角色建模、视频生成到智能配音的完整AI工具链,支持手绘线稿、国风古装、悬疑犯罪、未来科幻、末日废土、二次元、3D动漫等8种风格,构建从"生产"到"盈利"的完整闭环。

Ming-omni-tts – 蚂蚁集团开源的统一音频生成模型

Ming-omni-tts 是蚂蚁集团开源的统一音频生成模型,采用自回归架构实现语音、音乐和音效的联合生成。模型支持通过自然语言指令对语速、音调、音量、情感和方言进行细粒度控制,粤语方言控制准确率达93%,情感控制准确率46.7%,超越CosyVoice3。

Claude Sonnet 4.6 – Anthropic推出的最新一代AI模型

Claude Sonnet 4.6是Anthropic推出的最新一代AI模型,定位"高性能与高性价比"的平衡点。在编程、计算机操作、长文本推理和智能体规划等核心能力上实现全面升级,性能已接近旗舰Opus 4.6水平,API定价仅为其五分之一。

JoyAI-LLM-Flash – 京东开源的混合专家架构大模型

JoyAI-LLM-Flash 是京东开源的中型指令大模型,采用混合专家(MoE)架构,总参数量 48B,激活参数量仅 3B,支持 128K 超长上下文。模型创新性地引入 FiberPO 优化框架——首次将纤维丛理论应用于强化学习,结合 Muon 优化器进行 SFT、DPO 及 RL 训练;同时采用稠密多 Token 预测(MTP)技术,相较非 MTP 版本吞吐量提升 1.3-1.7 倍。

有戏AI – 风平智能推出的AI短剧一站式创作平台

有戏AI是风平智能推出的AI短剧一站式创作平台,定位为"新一代AI剧情生产与互动引擎"。平台整合剧本解析、角色设计、智能分镜、配音合成、成片导出等全流程功能,支持5万字超长剧本自动分集与跨集角色一致性控制,解决AI短剧"崩脸"行业痛点。

LobsterAI – 网易有道推出的桌面AI Agent

LobsterAI(中文名:有道龙虾)是网易有道推出的桌面级AI Agent,定位为"7×24小时全场景个人助理"。LobsterAI支持用户通过自然语言指令,可远程操控电脑完成复杂任务,从文件整理、数据分析、PPT生成,到搭建舆情监测平台等。

FireRed-Image-Edit – 小红书开源的通用图像编辑模型

FireRed-Image-Edit是小红书Super Intelligence团队开源的通用图像编辑模型,基于扩散架构,支持文本引导的图像编辑、老照片修复、虚拟试穿等多功能。

Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

Qwen3.5是阿里巴巴通义千问团队正式发布并开源的新一代原生多模态大模型。首发开源版本Qwen3.5-397B-A17B采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,总参数达3970亿但每次推理仅激活170亿参数,实现"以小胜大"——性能超越万亿参数的Qwen3-Max,部署显存降低60%,推理吞吐量最高提升至19倍。

MonsterClaw – 基于 OpenClaw 技术的本地AI执行系统

MonsterClaw 是基于 OpenClaw 内核的本地AI执行系统,完全部署在用户本地计算机上运行,无需将数据上传至云端,从根本上保障隐私安全。安装后,MonsterClaw 可直接操控本地环境——包括文件管理、浏览器操作、邮件处理等,支持通过 WhatsApp、Telegram、Discord 等即时通讯工具或 Web 控制台远程发送指令。

Kimi Claw – 月之暗面推出的云端AI智能体服务

Kimi Claw是月之暗面(Moonshot AI)推出的云端AI智能体服务,是 Kimi K2.5 大模型与开源 AI Agent 平台 OpenClaw 的深度集成方案,代表着当前最具性价比的"模型+Agent"组合之一。为用户提供类似OpenClaw的自动化助手功能,无需本地部署和维护。

Seedance 2.0教程 – AI视频创作完整操作手册与提示词指南

Seedance 2.0标志着AI视频创作从"提示词抽奖"迈入"导演级精准控制"时代,模型通过多模态输入与@引用机制,创作者可像调度真实剧组一样,用图片定风格、视频定运镜、音频定节奏、文字定剧情,彻底告别"写完提示词听天由命"的被动局面。

Xiaomi-Robotics-0 – 小米开源的机器人VLA模型

Xiaomi-Robotics-0是小米开源的首代机器人VLA(视觉-语言-动作)大模型,拥有47亿参数,采用MoT混合架构,Qwen3-VL多模态模型作为"大脑"理解视觉语言指令,Diffusion Transformer作为"小脑"生成高频动作块。

CoPAW – 阿里通义推出的个人智能体工作台

CoPaw 是阿里云通义实验室推出的个人智能体工作台。平台可部署在本地或云端,支持通过钉钉、飞书、QQ、Discord 等多频道对话交互,能按配置定时自动执行任务。

Seed2.0 – 字节跳动推出的系列通用模型

Seed2.0是字节跳动Seed团队推出的最新大模型系列,包含Pro(doubao-seed-2-0-pro-260215)、Lite(doubao-seed-2-0-lite-260215)、Mini(doubao-seed-2-0-mini-260215)三款通用Agent模型及专用Code(doubao-seed-2-0-code-preview-260215)模型。

实测 GLM-5 和 DeepSeek 新模型,对比谁更强?

看看昨天下午,不少友友发现 DeepSeek 新模型悄悄开启灰度测试。幸运的是,我第一时间就被灰度到了,正准备出一期实测分享。