OmniShow – 字节联合港中文、港大等开源的视频生成模型
OmniShow是字节跳动联合港中文、莫纳什、港大开源的多模态人-物交互视频生成模型。作为首个支持RAP2V(参考图+音频+姿势)的端到端框架,模型统一处理文本、图像、音频、姿势四种输入,单一12.3B参数模型即可生成10秒高质量视频。
Spark 2.0 – World Labs 开源的Web端 3D 高斯溅射渲染引擎
Spark 2.0是World Labs(李飞飞创立)开源的Web端3D高斯溅射渲染引擎,基于Three.js和WebGL2构建。Spark 2.0首创LoD细节层次系统、渐进式流式传输与虚拟内存技术,可在桌面、手机、VR等任意设备浏览器中实时渲染超1亿个splats的大规模3D世界。
GenieAI – 腾讯云 CodeBuddy 推出的 AI 应用生成平台
GenieAI 是腾讯云 CodeBuddy 推出的 AI 编程平台,只需用自然语言描述需求,可自动生成网页应用、微信小程序、游戏、PPT 等完整产品。
OiiOii 教程 – 0 基础 AI 漫剧制作指南,全自动动画团队
这就是今天正式上线的全球首个动画创作 Agent 工具——OiiOii,接入了满血版的 Seedance 2.0,而且内置了艺术总监、编剧、角色设计师、场景设计师、分镜师、音效总监等一整套专业创作类智能体。我们只需要给一句指令,剧本生成、角色设计、场景设计、分镜制作、音效生成、剪辑合成等等所有工作,这个 AI 视频创作团队都能会自动完成。
谷歌 Gemma 4 本地部署指南,手机、Mac、OpenClaw免费用
前不久,谷歌推出了开源模型 Gemma 4 系列,一共有四个版本。Arena AI 开源排行榜全球第三,数学竞赛 AIME 2026 成绩 89.2%,编程能力 LiveCodeBench 80.0%。能调用工具、能写代码、能驱动Agent,不只是聊天机器人,支持本地部署。今天就跟着橘子姐,一起来完成在手机和电脑上本地部署 Gemma 4 大模型,免费用上谷歌模型接入 OpenClaw 。
Acrobat Student Spaces – Adobe 推出的 AI 学习平台
Acrobat Student Spaces 是 Adobe 推出的 AI 学习平台,专为帮助学生高效备考设计。平台能将课件、笔记等资料一键转化为闪卡、测验题、思维导图,生成播客和视频摘要。
Mano-P 1.0 – 明略科技开源的 GUI-VLA 智能体模型
Mano-P 1.0是明略科技开源的GUI-VLA智能体模型,采用纯视觉驱动,无需API可直接操控桌面软件与网页界面。模型提供72B完整版与4B量化版,支持Apple M4芯片本地部署,实现数据零上云与物理隔离级隐私保护。
HeyGen CLI – HeyGen 推出的命令行工具
HeyGen CLI是HeyGen官方推出的命令行工具与MCP服务器,基于Model Context Protocol协议构建。工具支持开发者及AI助手(如Claude、Cursor)通过自然语言直接调用HeyGen API,实现数字人视频生成、头像与语音管理、账户查询等功能。
LibTV Seedance 2.0真人视频教程:0.35元/秒AI视频生成攻略
LibTV Seedance 2.0 支持真人模式了!Seedance 2.0 刚面世时,各大平台上 AI 二创视频爆火,和詹姆斯球场单挑、跟周星驰合拍电影...让大家第一次见识到了 AI 视频生成的恐怖实力。
实测扣子童锦程 Skill,打造 24 小时 AI 情感顾问
现在跟 AI 聊的越来越多,跟人却没什么话说了。遇到心动 Crush,只能憋出一句干巴巴的“在吗”...暧昧对象忽冷忽热,每天都在猜“Ta 到底喜不喜欢我?”在感情里,往往就是当局者迷。如果有一个人能帮我们分析局势、一秒识破套路,指点迷津,那该多好。最近,我在扣子上搭建了一个 AI 情感大师,可以帮我们高情商助攻追 Crush、一眼分辨渣男绿茶、精准剖析情感死局。
QinyanClaw – 沁言学术推出的云端学术科研智能体
QinyanClaw是沁言学术推出的全球首个为学术科研场景深度优化的云端智能体。基于OpenClaw架构,智能体具备长期记忆和自主执行能力,可7×24小时在云端独立运行,无需保持电脑在线
PokeClaw – 开源的全本地离线运行手机 AI Agent 应用
PokeClaw(全称 PocketClaw)是开源 Android AI 自动化应用,由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理,基于 Google Gemma 4 模型通过 LiteRT-LM 运行时直接在设备端推理,无需联网、账户或 API 密钥即可自主控制手机。
LPM 1.0 – 米哈游蔡浩宇推出的 AI 视频生成模型
LPM 1.0(Large Performance Model)是Anuttacon(蔡浩宇AI公司)推出的17B参数视频角色表演生成模型,支持实时全双工音视频对话。
Trooly – AI Native用户研究平台,实时检测受访者情绪信号
Trooly(元生万物)是AI-Native用户研究平台,通过多模态Voice Agent技术提供AI主导的深度访谈服务。平台能以12倍于传统调研机构的速度,在24小时内完成从方案设计、精准用户招募到深度访谈执行的全流程,覆盖全球25个国家约1.8亿潜在受访者。
TripStar – 开源 AI 旅行规划工具,多智能体协作规划旅行
TripStar(旅途星辰)是基于HelloAgents框架的AI文旅智能体应用,通过LLM与多智能体协作解决旅行规划中的信息过载问题。
MiniMax Music 2.6 – MiniMax 推出的全新 AI 音乐生成模型
MiniMax Music 2.6是MiniMax推出的全新AI音乐生成模型,实现从底层架构到创作体验的全维进化。该版本将首包延迟压缩至20秒内,突破性解决"开盲盒"痛点,实现精准的BPM锁定、精细的段落结构控制与深度情绪表达。
FIPO – 阿里通义推出的强化学习算法
FIPO(Future-KL Influenced Policy Optimization)是阿里通义实验室推出的强化学习算法,通过Future-KL机制量化每个token对后续推理轨迹的影响力,实现token级精准信用分配,解决传统RL"奖罚平摊"导致的推理瓶颈。
claude-code-best-practice – 开源的Claude Code系统化使用指南
claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从"氛围编程"进阶到"智能体工程",收录 86+ 条实战技巧,涵盖 Agents、Commands、Skills、Hooks、MCP 等核心模块,对比 10+ 套主流开发工作流。
智谱 GLM-5.1 开源实测:编程能力登顶 SWE-bench Pro
GLM-5.1 这么能打?!复杂软件工程超越 Claude Opus 4.6?!上月底,智谱 GLM-5.1 对所有 GLM Coding plan 用户开放。
TapNow Seedance 2.0实测:《牌子》《纸手机》AI制作全流程开源
这几天 AI 视频神作频出。比如让人分不清现实和梦境的视觉神作《牌子》,全网播放量超 5000 万,一举斩获 B 站 AI 创作大赛冠军的百万大奖。甚至连《流浪地球》的郭帆,都在为他转发点赞。
粤公网安备 123456789号