SoulX-Podcast – Soul推出的多说话人语音合成模型
SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川话、河南话、粤语等),具备跨方言提示功能,可通过普通话提示生成目标方言语音。
Agent HQ – GitHub推出的集成AI智能体平台
Agent HQ是GitHub推出的集成AI智能体的创新平台,将各种AI工具无缝融入开发者的工作流中。通过Mission Control提供统一的指挥中心,让开发者可以在GitHub网站、VS Code、移动端或命令行界面中轻松分配、指导和跟踪多个AI智能体的任务。
GigaBrain-0 – 开源VLA具身模型,基于世界模型生成的数据
GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了跨任务泛化能力。采用 RGB-D 输入建模,增强了空间感知能力,通过具身思维链(Embodied CoT)监督,强化了模型在任务执行中的推理能力。
怎么用AI制作三宫格图片,附“山的后面是什么”同款提示词
AI又双叒叕被玩出花来了。最近抖音上有个话题爆火——山的后面是什么。经典台词,配上三宫格图片,文艺感拉满了。 “山的后面是什么。” “你不用告诉我。” “我会自己去看。” 很多人都用自己的照片复刻这种三宫格图片,一张图一个故事,就像在拍人生电影。做法非常简单,不用懂摄影,也不用PS,一句提示词就能让AI帮你生成各种有意思的三宫格图片,0基础也能一分钟学会。
Glyph – 智谱联合清华开源的视觉文本压缩框架
Glyph 是智谱联合清华大学 CoAI 实验室开源的创新框架,能通过视觉 - 文本压缩解决大语言模型(LLM)上下文过长的问题。框架将长文本渲染为图像,用视觉语言模型(VLM)处理图像,实现 3 - 4 倍的上下文压缩。
FlowithOS邀请码 – 怎么获取FlowithOS邀请码?互助免费领
FlowithOS目前为公测阶段需邀请码体验,每个用户登录成功有5个邀请码,已订阅用户可直接使用。AI工具集官方提供了FlowithOS邀请互助群,免费共享邀请码,互助解锁优先体验。
FlowithOS – Flowith推出的首个智能体操作系统
FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件管理、游戏操作等。
Pomelli – Google Labs推出的AI营销工具
Pomelli 是 Google Labs 推出的 AI 营销工具。用户输入品牌网站地址,Pomelli 能在短时间内分析网站的配色、风格等元素,自动生成符合品牌调性的营销文案和图片素材。工具具备局部编辑和二次编辑功能,方便用户对生成内容进行优化调整。
Remy – AI 3D模型生成应用,支持360度自由环视
Remy 是Kiri Innovations公司推出的基于3D高斯溅射技术的空间记录应用,用户可通过手机拍摄视频快速生成逼真的3D场景。应用随华为鸿蒙OS 6系统发布,上线后迅速登顶鸿蒙应用商店下载榜,支持沉浸式探索模式和跨设备分享。
Mistral AI Studio – Mistral AI推出的企业级AI应用开发平台
Mistral AI Studio 是法国 AI 初创公司 Mistral AI 推出的企业级 AI 应用开发平台,帮助企业将 AI 从原型开发过渡到可靠、可扩展的生产系统。具备三大核心功能:深度可观察性(Observability),提供全面的 AI 应用运行监控与改进能力
Hailuo 2.3 – MiniMax推出的AI视频生成模型
Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加流畅自然且复杂的动态画面,支持多种画风,如动漫、水墨等。模型对运动指令的响应更加精准,画面效果接近实拍。
Grokipedia – xAI推出的新型AI知识平台
Grokipedia是埃隆·马斯克旗下人工智能公司xAI开发的新型知识平台。基于xAI的Grok AI系统构建,通过AI技术修正知识库中的信息并补充背景。Grokipedia的核心亮点是融合了Grok AI聊天机器人,能对平台内容进行自动筛查与错误纠正。
Sky – Shortcuts推出面向Mac的AI自动化工具
Sky是Shortcuts团队推出的AI驱动的自动化工具,专为Mac设计。工具支持与任何窗口和任何应用程序进行交互,基于自然语言处理和AI技术,帮助用户快速完成任务。
豆包视频生成1.0 pro fast – 火山引擎推出的AI视频生成模型
豆包视频生成模型1.0 pro fast(Doubao-Seedance-1.0-pro-fast)是火山引擎推出的高效AI视频生成模型。模型在继承上一代核心优势的基础上,实现生成速度最高提升3倍,价格直降72%的突破。
Turbo AI – AI笔记学习工具,创建结构化可编辑的笔记
Turbo AI 是提供AI笔记和学习工具的平台。能将PDF、YouTube视频或音频转换成美观的笔记和学习工具,操作过程简单。用户可以实时录制讲座或上传PDF、视频、音频文件和文档,支持多种格式。
Ada – 腾讯推出的AI程序员工具
Ada 是腾讯推出的首个 Technical Preview 版本的 AI 程序员工具,能实现从需求到上线的全流程自动化开发,包括一键提需求、自动修复线上缺陷、生成文档与单元测试、智能代码评审等功能。
Navos – 钛动科技推出的首款出海营销AI Agent
Navos 是钛动科技推出的全球首款出海营销 AI Agent,覆盖出海营销全链路,由多个专职 Agent 组成,实现从策划到投放、数据分析的自动化操作。Navos 支持多模态内容生成,可处理文本、视觉、音频、视频等素材,生成符合需求的创意内容,能进行深度数据分析与优化。
ValueCell – 开源金融多Agent平台,协同工作提供财务洞察
ValueCell 是开源的金融多智能体平台,通过 AI 技术加速金融投资研究与决策。将投研流程中的各种能力模块拆分为独立的智能体(Agent),如市场研究、数据抓取、情绪分析、策略生成等,将这些智能体连接起来,形成一个协作且可扩展的投研生态系统。
ChatGPT for any role – OpenAI推出的ChatGPT提示词模板
ChatGPT for any role是OpenAI官方推出的 ChatGPT 提示词模板,能帮助用户更高效地使用 ChatGPT 完成各种工作任务。模板覆盖从邮件撰写、会议协作到决策分析和效率提升等多种工作场景,适用销售、产品、市场营销、程序员、管理者等不同职业角色。
Nimo – AI工作平台,无限画布整合所有AI应用和工具
Nimo是创新的AI工作平台,支持将所有AI应用和工具整合到无限画布上,彻底解决多任务切换的困扰。Nimo支持与100+应用(如Gmail、Google Sheets、Notion等)无缝连接,通过智能卡片和动态应用生成,实现高效工作流。
粤公网安备 123456789号