Qwen-Robot Suite – 阿里通义推出的物理世界基础模型套件
Qwen-Robot Suite 是阿里通义推出的迈向物理世界智能的基础模型套件,包含 Qwen-RobotNav(导航)、Qwen-RobotManip(操作)与 Qwen-RobotWorld(世界模型)三大基础模型。
AI版支付宝 – 蚂蚁集团支付宝推出的超级生活 AI 助手
AI版支付宝是蚂蚁集团支付宝推出的AI工具,为支付宝近20年来最重大的改版。不再只是支付工具,是原生AI驱动的超级生活入口。界面可一键切换为“资产”与“阿宝”双版块,前者用卡片夹聚合你的流动、理财与信用资产,后者以对话式AI助手接管点餐、订票、转账等8000余项服务。
Seedance 2.0 Mini – 字节跳动推出的轻量化视频生成模型
Seedance 2.0 Mini 是字节跳动火山引擎推出的高性价比轻量化视频生成模型。模型在保留核心多模态参考生成能力的前提下,将生成成本降低约 50%,速度提升至 Seedance 2.0 Fast 的 2 倍,主打快速批量创意视频、短视频制作及项目前期草稿场景。
AI版支付宝邀请码 – 怎么获取AI版支付宝邀请码?附免费领取方式
昨天 AI 届又迎来了大事。支付宝近 20 年迎来最重大的改版,AI 版支付宝(内部代号"宝计划")正式开启内测阶段,尚未全面开放,需通过邀请码机制体验。
MMAE – 腾讯混元联合高校推出的音频编辑评测基准
MMAE(Massive Multitask Audio Editing Benchmark)是首个面向通用指令式音频编辑的大规模多任务评测基准,由上海交通大学、上海创智学院、南洋理工大学、腾讯混元团队等机构联合推出。
turbovec – 谷歌开源的向量索引新算法
turbovec 是 Google Research TurboQuant 算法的开源实现,由 Rust 编写并附带 Python 绑定,是面向 RAG 场景的高性能向量索引库。工具采用数据无关的量化策略,无需训练阶段可将 1000 万条 float32 向量从 31GB 压缩至约 4GB。
AI版支付宝邀请码 – 怎么获取AI版支付宝邀请码?附免费领取方式
昨天 AI 届又迎来了大事。支付宝近 20 年迎来最重大的改版,AI 版支付宝(内部代号"宝计划")正式开启内测阶段,尚未全面开放,需通过邀请码机制体验。
OpenSquilla – 开源的微内核 AI Agent 框架,可降低Token成本
OpenSquilla是开源、可自托管的Token高效型微内核AI Agent运行时,主打"同样的预算,更高的智能密度"。采用极简微内核架构(核心仅约100行代码),通过本地ML模型路由、自适应推理深度、四层认知记忆系统和按需技能加载,可将Token成本降低60-80%。
Ponytail – 开源的 AI Agent 代码精简插件,减少代码量
Ponytail 是开源的 AI Agent 代码精简插件,通过向 Claude Code、Codex、Cursor 等 10+ 主流 AI 编码工具注入"资深懒人开发者"的极简思维,强制 Agent 在写代码前按六步阶梯判断必要性,能减少 80-94% 的代码量、降低 47-77% 的调用成本。
Gemini-SQL2 – 谷歌推出的文本转 SQL 任务 AI 模型
Gemini-SQL2是Google Research最新推出的AI模型 ,是基于 Gemini 3.1 Pro ,具备最顶尖的 Text-to-SQL 能力。模型在 BIRD 基准单模型赛道用 80.04% 执行准确率登顶,将自然语言直接转化为可执行 SQL 查询,无需手写数据库语句。
Kimi K2.7 Code 深度实测 – 代码生成能力全解析
朋友们,Kimi 又更新了。这次发布的是 Kimi K2.7 Code,与 Kimi K2.6 使用相同架构,是基于 Kimi K2.6 继续训练的 Coding 专项版本。
OiiOii 2.0 实测 – 智能画布实现 AI 视频创作自动化
最近刷到很多街头猫咪做饭的视频,越看越上头。两只小猫在路边小摊忙前忙后,一只认真干活,一只调皮捣乱但又特别可爱,视频热度也很高。
Fusion – OpenRouter 推出的多模型智能融合服务
Fusion 是OpenRouter推出的多模型智能融合服务,通过将同一提示词并行分发给多个模型独立作答,由裁判模型分析各回答的共识、矛盾与盲区,最终融合输出最优答案。
一手实测 AhaCreator – 5 步骤重构海外达人营销全流程
上个月跟一个做AI产品出海的朋友吃饭,他说他们团队最近有点“不对劲”。以前一个 Campaign 从找人到上线,两三个月是常态,催稿催到想摔手机。但这几个月,同样的团队规模,三周就跑完了一轮,产出的达人数量翻了好几倍。直到我拿到了 AhaCreator 的 demo 环境,自己从头到尾跑了一遍,确实不太一样。
GLM-5.2 – 智谱AI推出的最新旗舰开源大模型
GLM-5.2是智谱AI推出的最新旗舰开源大模型,采用MIT协议开源,主打Agentic Coding与超长上下文能力。模型支持1M tokens上下文窗口,可处理大规模代码库与复杂长程任务,支持思考/标准双模式推理。
PP-OCRv6 – 百度飞桨 PaddleOCR 开源的第六代 OCR 模型
PP-OCRv6 是百度飞桨 PaddleOCR 团队推出的第六代开源 OCR 模型,首次推出 Tiny(1.5M)、Small(7.7M)、Medium(34.5M)三档模型,覆盖从浏览器端到服务器的全算力平台。
声忆 – AI 语音输入法,支持本地 ASR 离线识别
声忆是专为 macOS 打造的语音输入法,主打"说得比打字快"。按住右 Option 说话,松开后仅需 1.4 秒即可将语音转为文字并自动插入光标处,支持中英混输与本地 ASR 离线识别。
YoooClaw C·ONE AI 记忆卡片实测 – 手机变身AI Agent控制中心
最近,极客圈有一个小玩意爆火,网友手搓了一个小小的红绿灯,用三色灯在电脑上物理展示 AI Agent 的工作状态。看得我疯狂心动...最近我也入手了一个好玩的物理 AI 外挂——YoooClaw C·ONE,它可以直接磁吸在我手机背面,设计得非常轻薄,平时带着也不会有明显负担。
openPangu 2.0 – 华为开源的盘古大模型升级版
openPangu 2.0 是华为开源的盘古大模型重大升级版,提供最高 505B 参数的 Pro 版本与 92B 的 Flash 版本,模型统一搭载 512K 超长上下文,原生深度调优昇腾与麒麟芯片。
iArt.ai – AI动态图形生成工具,专注矢量动态图形
iArt.ai 是 AI 驱动的动态图形生成工具,定位为 Adobe After Effects 的零学习曲线替代方案。用户只需用自然语言描述创意、上传 Figma 设计或输入音频,AI 代理即可在 30 秒内自动完成布局、排版、动画、转场和节奏,生成广播级矢量动画。
粤公网安备 123456789号