GenflowAI – 商业 AI 工具市场,一键转化为完整商品图集

GenflowAI 是面向电商创作者和品牌的商业 AI 工具市场,将单张产品照片一键转化为完整的商品图集(包括主图、场景图、卖点图等),支持 Amazon、Shopify、TikTok Shop 等主流电商平台的素材规格输出。

妙呀 – 大麦娱乐联合阿里通义推出的 AI 潮玩设计平台

妙呀是全球首个面向潮玩创作者的AI设计平台,由大麦娱乐与阿里通义大模型事业部联合发布,依托Wan2.7大模型技术打造。平台以"所有灵感来自于你"为核心理念,用户只需输入创意文本,即可快速生成2D概念图与3D模型,支持实时调整比例、材质、表情等细节。

Open Code Review – 阿里开源的 AI 代码审查 CLI 工具

Open Code Review 是阿里巴巴开源的 AI 代码审查 CLI 工具,源自集团内部服务数万名开发者、执行超百万次审查任务的生产级实践。

码上飞 Vibe Coding 实战 – 10 分钟搭建餐饮点餐小程序

以前开个小店,要会选品、会装修、会拍图、会做客服、会写文案、还要懂一点点技术。如果选择入驻现有的各大电商平台,免不了要交手续费,还要受各种繁琐规则的约束。不过最近我发现,很多完全没有技术背景的朋友,都在用一个叫码上飞的工具轻松破局。用码上飞,我用自然语言就能直接 Vibe Coding 一个能用的小程序~全程不用写代码,而且功能很完整,包含前后端,有支付功能,内置 AI 客服,还可以根据应用信息生

PlanningBench – 腾讯混元等开源的大模型规划能力评测框架

PlanningBench 是腾讯混元团队联合中国人民大学高瓴人工智能学院等机构推出的开源框架,专注于大语言模型的规划能力评测与训练。

PawBench – 阿里通义推出的通用智能体评测基准

PawBench 是通义实验室推出的通用智能体评测基准,面向个人助理与 Agent 场景,将底座模型与运行框架(Harness)纳入同一评测体系。

7 个不同工作场景该用哪些 Skill?一文看懂

新一期干货来了~分享一篇普通人在不同工作场景下,应该使用哪些 Skill 或者 Skill 组合。Skill 把重复步骤固定下来。一套已经写好的工作方法,什么时候触发、按什么顺序做、输出什么格式。所以这篇文章可以直接找到自己的场景,照着安装其中的 Skill ,用提示词跑一遍完整任务。可以在任何支持 Skill 能力的 Agent 上使用、执行任务

Magenta RealTime 2 – 谷歌Magenta开源的实时音乐生成模型

Magenta RealTime 2(MRT2)是谷歌 Magenta 团队推出的第二代开源本地实时音乐生成模型。MRT2 基于逐帧生成架构,每帧 40 毫秒,实现约 200 毫秒的实际控制延迟,让 AI 对输入变化的反应速度接近真实乐器演奏体验。

WorkBuddy企业版 – 腾讯推出的企业级 AI 智能工作台

WorkBuddy企业版是腾讯推出的企业级AI智能工作台,面向AI原生组织转型提供7×24小时数字员工、人机协同"项目"模式及企业管理后台,原生接入腾讯文档、网盘与乐享,支持公有云、VPC专享及私有化部署。

html-video – Open Design 团队开源的 HTML 版剪映

html-video 是 OpenDesign 团队(nexu.io)开源的HTML版剪映,基于 hyperframes 框架构建。工具让 Agent 通过写 HTML 可生成世界级水准的产品宣传、知识解说等视频,内置 20+ 顶级模板,支持分页编辑、多尺寸导出与 Minimax AI 配音配乐。

GitNexus – 开源代码知识图谱引擎,构建完整依赖关系图

GitNexus 是开源的代码知识图谱引擎,通过 Tree-sitter 解析将代码仓库构建为完整的依赖关系图,用 MCP 协议向 Cursor、Claude Code、Codex 等 AI 工具暴露结构化上下文。

AhaCreator – AI 原生海外达人营销平台,全流程 AI 托管

AhaCreator(原名 Aha)是 AI 原生的海外达人营销平台,致力于用 AI Agent 接管达人营销的全流程执行,让品牌方只需在关键节点做决策。平台覆盖 140+ 国家,拥有 500 万+ 预筛选达人池。

GreenConvert – AI 音视频转录平台,双引擎转录模式

GreenConvert 是 AI 音视频转录平台,通过神经引擎将音视频转为文字,支持 98 种以上语言,准确率达 98%。平台内置说话人识别、音频修复与多语言翻译,可处理长达 10 小时的文件。

Microsoft Scout – 微软推出的 AI 个人助手

Microsoft Scout 是微软推出的 AI 个人助手,基于 OpenClaw 开源技术构建。工具拥有独立 Entra 身份,可在后台持续自主运行,无需用户逐次触发。

Gemma 4 12B – 谷歌开源的多模态大模型

Gemma 4 12B是谷歌开源的多模态大模型,采用业界首个无编码器统一架构,视觉和音频数据直接输入LLM主干,彻底砍掉独立编码器。

BrowserAct Skills – 开源的 AI Agent 浏览器自动化 CLI 工具

BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI 工具,能解决 Agent 操控浏览器时的核心痛点,无 Cookie 环境、反爬拦截、验证码阻断、人机协作断层等。

Step 3.7 Flash开源模型实测 – 多模态 Agent 大脑更省Token

Flash 模型现在已经不只是旗舰模型更快、更便宜的平替。而是能放进 Agent 工作流里,让每一步都更快、更稳、更省。最近,阶跃星辰推出了新一代高效率 Flash 开源模型 Step 3.7 Flash。官方介绍里,Step 3.7 Flash 是 198B 参数稀疏 MoE 多模态模型,每个 token 激活约 11B 参数,支持 256K 上下文,最高吞吐可达 400 tokens/s,也支

Ideogram 4 – Ideogram 开源的文本到图像生成模型

Ideogram 4 是 Ideogram 推出的首个开源文本到图像生成模型,拥有 93 亿参数,从头训练非基于现有模型微调。模型专为高质量图像生成而设计,尤其在设计、营销图形、Logo、海报、广告和社交媒体视觉内容方面表现突出。

Kimi Work – 月之暗面推出的通用型本地 Agent

Kimi Work 是月之暗面推出的面向知识工作者的通用型本地 Agent,随 Kimi 最新测试版 Mac 和 Windows 客户端推出。

Toonflow – 开源的一站式 AI 短剧创作工具

Toonflow 是开源的一站式 AI 短剧创作工具,将小说、剧本通过多 Agent 协作自动转化为结构化剧本、智能分镜、角色视觉和动画视频,实现小说→剧本→分镜→视频,全流程 AI 自动化生产。