方舟 CLI – 字节跳动火山引擎推出的命令行工具
方舟 CLI是字节跳动旗下火山引擎推出的命令行工具,面向后端开发者与 Agent 构建者,提供一行指令接入任意 Agent的极简体验。
Seedance 2.5 – 字节跳动推出的最新视频生成模型
Seedance 2.5 是字节跳动旗下豆包视频生成模型的最新旗舰版本,预计 7 月初全面上线。作为 Seedance 2.0 的重大升级,模型实现了三大全球突破,单段原生视频直出长达 30 秒、支持 50 个全模态参考素材联合输入、以及更可控的局部视频编辑能力。
5K Stars自媒体配图 Skill – 小黑 Skill 手绘文章配图实测教程
今天发点适合做配图的东西。做自媒体这件事,写文章只是基础,配图能力也越来越重要。现代人已经很难去认认真真的看完一篇长文了,反而是有趣的配图会多看两眼。这里给大家推荐一个超有趣的配图项目:ian-xiaohei-illustrations,我一般叫小黑 Skill。
Spatial-TTT – 清华联合混元开源的流式视觉空间智能框架
Spatial-TTT 是清华大学、腾讯混元与南洋理工大学联合推出的流式视觉空间智能框架。框架仅 2B 参数,通过 Test-Time Training(TTT)技术,在观看视频流的过程中持续更新内部空间记忆,实现对长达 120 分钟视频的空间推理。
豆包2.1 – 字节跳动推出的新一代深度思考大模型
豆包2.1 是字节跳动面向 Coding 与 Agent 时代打造的新一代深度思考大模型,提供 Pro、Turbo 和 Evolving 三个版本,在 Coding 工程交付、Agent 长链路任务执行与多模态理解三大方向全面升级,具备更强的需求理解、长期规划与动态修复能力。
AudioX-Turbo – Noiz AI 联合清华推出的音频生成框架
AudioX-Turbo 是 Noiz AI 联合香港科技大学、清华大学推出的统一高效音频生成框架,支持文本、视频、音频任意组合输入生成高质量音效与音乐。
Boogu-Image-0.1 – Boogu开源的统一图像生成与编辑模型
Boogu-Image-0.1 是 Boogu 团队开源的统一图像生成与编辑模型家族。模型在同一架构下同时支持文生图、指令式图像编辑及中英双语文本渲染,家族包含 Base、Edit和 Turbo三个变体。
VidMuse – Sand.ai 推出的 AI 音乐视频 Agent
VidMuse 是 Sand.ai 推出的 AI 音乐视频 Agent。用户只需上传 Suno 链接或 MP3 文件,可自动生成 30–60 秒的音乐视频。VidMuse 2.0 基于Video as Code理念,从固定 Workflow 升级为开放 Agent,能自主调度资源、组织分镜与叙事。
HappyHorse 1.1 – 阿里推出的升级版AI视频生成模型
HappyHorse 1.1是阿里最新上线的AI视频生成模型升级版,较 1.0 版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力五大维度实现系统性升级。
Seko无限画布实测 – 一键完成AI短剧创作
AI 短剧漫剧是今年大热的赛道,画面抓人、吸粉快且变现路径清晰,后续可以接小说改编、商单素材、课程等等,不少人都想入局分一杯羹。
Xiaomi Miloco 2.0 – 小米开源的全屋智能 AI 方案
Xiaomi Miloco 2.0 是小米基于 MiMo-V2.5-Pro 大模型推出的开源全屋智能 AI 方案,通过 OpenClaw 以 Agent 形式接入,实现多模态感知、主动智能、持续任务与家庭记忆四大能力,让智能家居从被动执行进化为懂家、懂人的主动服务管家,原始数据本地保存,隐私安全可控。
Sakana Fugu – Sakana AI 推出的多智能体编排系统
Sakana Fugu是Sakana AI推出的多智能体编排系统,用单一API动态调度顶尖模型。系统分配思考者、执行者与验证者角色,自动完成选择、委派与合成,无需预设工作流。
SpatialClaw – 英伟达联合 KAIST 推出的免训练空间推理框架
SpatialClaw 是 NVIDIA Research 与 KAIST 联合推出的免训练空间推理框架,通过代码即动作机制在持久化 Python 内核中迭代执行复杂 3D/4D 空间推理任务,在 20 项基准上平均准确率达 59.9%,超越此前最优方法 11.2 个百分点。
Skill Zoo – 面向 Coding Agent 的一站式桌面技能管理工具
Skill Zoo 是面向 Coding Agent 的一站式桌面技能管理工具。工具通过 SSOT+ 软链接架构,统一管理分散在 Claude Code、Codex、Trae CN、Hermes 等编程工具中的 Agent Skills。
Agently Mail – 腾讯QQ邮箱推出的AI Agent专属邮箱服务
Agently Mail 是腾讯QQ邮箱团推出的AI Agent专属邮箱服务,与个人邮箱完全隔离,原生适配Agent框架。Agent可通过微信扫码授权获得独立邮箱地址,安全地收发邮件、管理附件、搜索邮件,支持两阶段确认机制防止误操作。
Cowart – 开源的本地无限画布插件,让 Codex 看图说话
Cowart是豆包桌面端产品经理钟二信开源的面向 OpenAI Codex 的本地无限画布插件。工具基于 tldraw 框架构建可视化画布,让 Codex 在本地电子白板上摆放图片、画箭头标注、保留迭代版本,实现从聊天框改图到画布标注迭代的范式转变。
天工设计智能体实测 – 一句话生成可迭代网页
让 AI 生成一个漂亮的网页,现在已经不稀奇了。麻烦的是能不能持续迭代。很多 AI 页面第一眼看起来很香,但我们还想再增加一个页面时,AI 很可能突然“失忆”,又重新生成一个配色、排版完全不同的新页面。
MaineCoon – AI 实时音视频世界模型,专为社交互动场景
MaineCoon 是全球首个专为社交互动场景优化的实时音视频自回归世界模型。模型拥有 220 亿参数,能在单 GPU 上实现47.5 FPS 的实时流式生成,支持亚秒级交互响应与千秒级连续音视频生成。
MotiClaw – 本地优先的 AI 伙伴与智能体控制平台
MotiClaw 是本地优先的 AI 伙伴与智能体控制平台,用户可在自己的 macOS 或 Windows 电脑上安装、配置并管理一支 AI 助手团队,将内容创作、客户跟进、资料整理、发版准备等重复性工作交给 AI 处理。
《Prompt / Context / Harness / Loop 四大AI工程详解》(PDF文件)
《Prompt /Context/Harness /Loop四大AI工程详解》是致网科技模智空间推出的55页深度报告,系统提出Prompt、Context、Harness、Loop四大AI工程体系,覆盖从意图表达、信息供给、安全执行到自主循环的完整链路。
粤公网安备 123456789号