HiClaw – 阿里云开源的多Agent团队协作系统

HiClaw 是阿里开源的Agent 团队协作系统,定位"Team 版 OpenClaw"。系统引入 Manager Agent 作为 AI 管家,自动协调多个 Worker Agent 完成复杂任务。

泡漫 – 掌阅科技推出的一站式AI漫剧生成平台

泡漫是掌阅科技推出的一站式AI漫剧生成平台,专注用AI重新定义漫剧创作。平台整合超1万部小说IP,提供动态漫、解说漫、AI真人剧等多种形态,将制作周期压缩至5-7天,成本降低约70%。

Phi-4-reasoning-vision-15B – 微软开源的多模态推理模型

Phi-4-reasoning-vision-15B是微软开源的150亿参数多模态推理模型,基于Phi-4-Reasoning语言模型和SigLIP-2视觉编码器构建。

MiniMax Music 2.5+ – MiniMax推出的AI音乐生成模型

MiniMax Music 2.5+是MiniMax推出的AI音乐生成模型,主打纯音乐创作能力。模型支持古典管弦、电子、氛围音等多元风格,覆盖冥想、助眠、游戏、影视等全场景。

播面 – AI面试备考工具,支持AI深度追问解答

播面是播客形式的技术面试题学习平台,主打"戴上耳机听懂面试题"。平台将枯燥的八股文转化为音频讲解,覆盖Java、Spring、Redis、Kafka、LLM等30+主流技术栈,提供3000+精选题目与AI深度追问解答。

阿里QoderWork实测 – 打工人桌面AI助手,零配置替代OpenClaw

最近科技圈被一只小龙虾(OpenClaw)刷屏了,看着无数友友晒出 AI 自己操控电脑、写代码...确实很吸引人。但实际要配置 OpenClaw,不仅要懂怎么配本地环境、下载庞大的语言模型包,还得保证电脑 24 小时开机,随时待命...甚至折腾半天最后还是跑不起来。

如何用AI快速创作多平台适配内容,从想法到成品只需3步

你是不是也这样:对着空白文档发呆两小时,最后写了删、删了写;好不容易凑完内容,调字体行距又折腾到深夜。换个平台更头疼:小红书要抓眼球封面,海报要设计感,Word 要规范格式,一套流程下来,创意早被磨没了……PagePop 就是来解决这些"创作内耗"的——说清需求,帮你生成、排版、配图,H5/公众号/海报/小红书/Word 全搞定,让创作回归简单。

纳米漫剧流水线 – 360推出的AI漫剧生成平台

纳米漫剧流水线是360推出的工业级AI漫剧生成平台,通过空间引擎建立三维坐标系,解决AI视频角色/场景不一致的痛点。

MagicAgent – 荣耀联合复旦推出的智能体基础模型

MagicAgent是荣耀联合复旦大学推出的智能体基础模型,以32B密集架构和30B-A3B MoE架构实现百亿参数内最强性能。

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善"爱说教、太啰嗦"的机械语气,回答更直接自然,联网搜索时整合质量更高,能结合知识图谱提供深度分析,避免简单罗列链接。

Gemini 3.1 Flash-Lite – 谷歌推出的轻量级旗舰模型

Gemini 3.1 Flash-Lite是Google推出的轻量级旗舰模型,主打极致性价比。模型以每秒363 token的输出速度、0.25美元/百万token的输入价格,在速度上碾压GPT-5 mini(快5倍),价格为Claude 4.5 Haiku的四分之一。

MaxClaw部署教程 – 10秒云端搭建OpenClaw,免服务器接入钉钉飞书

最近的AI圈几乎都被这只龙虾刷屏了...OpenClaw 可以像真人一样理解指令,并自己拆解任务,自动跑完我们要求的整个工作流程,但部署门槛难倒了一大批人。我发现最近 MiniMax Agent 发布了一个云端的 OpenClaw——MaxClaw,在 Web 端点几下鼠标,10 秒钟就能部署完成,最爽的是可以接入钉钉和飞书,通过手机直接控制~

Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle"自由指令生成,能根据自然语言描述,一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频,实现"人物+场景"的一体化声音创作。

Fun-CosyVoice3.5 – 阿里通义实验室推出的语音生成模型

Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力——用户无需掌握专业参数,直接用口语化指令如"语气坚定一点""语速慢一点"即可精准调控语音效果,实现"一句话自由生成语音"。

FireRed-OCR – 小红书开源的轻量级文档结构解析视觉语言模型

FireRed-OCR 是小红书团队开源的轻量级文档结构解析视觉语言模型,以仅 2B 参数的规模在 OmniDocBench v1.5 权威评测中斩获 92.94% 综合得分,超越 GPT-5.2、Gemini-3.0 Pro 及 Qwen3-VL-235B 等超大模型,实现了"小模型击败大模型"的突破。

Epismo – AI工作流管理与协作平台,支持AI技能封装

Epismo 是 AI 工作流管理与协作平台,致力于将零散的 AI 操作经验转化为标准化的"技能"单元。平台支持 Gemini、Claude、ChatGPT 等多种 AI Agent 协同工作,用户可通过自然语言指派任务、智能拆解目标,在可视化看板中管理人机混合团队。

theORQL – 前端AI编程工具,支持自动复现与修复闭环

theORQL 是具备视觉感知能力的前端 AI 编程工具。工具打通了 Chrome DevTools 与 VS Code/Cursor,实现运行时全景感知,能捕获 DOM、CSS、网络请求和 Console 日志,精准映射 UI 元素到源码。

Goose – 开源本地AI Agent框架,自主执行完整开发

Goose 是 Block 开源的本地 AI Agent 框架,能自主执行完整工程任务——读文件、写代码、跑测试、调 API、自动 Debug,出错后自我修正直至完成。

Nano Banana 2 实测 – 谷歌 Gemini 3.1 Flash Image 登顶 Arena 生图榜第一

Nano Banana 2 来了。昨天,谷歌推出最新图像模型 Nano Banana 2(Gemini 3.1 Flash Image),发布即空降 Arena 文生图排行榜第一!Lovart 第一时间就可以体验了,本 Pro 会员还可以免费玩 Nano Banana 2,真香了。这篇文章,就跟大家分享一下,Nano Banana 2 的一些创意玩法。昨天,谷歌推出最新图像模型 Nano Bana

OpenSandbox – 阿里巴巴开源的通用 AI 应用沙箱平台

OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台,采用 Apache 2.0 协议,专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK(Python、Java/Kotlin、JavaScript/TypeScript)和统一沙箱 API,内置 Docker 和 Kubernetes 运行时支持,可快速部署代码解释器、浏览器自动化、桌面环境(VNC/VS Code)等