AI项目

Aardvark – OpenAI推出的漏洞发现与修复智能体

Aardvark 是 OpenAI 推出的基于 GPT-5 的智能体,能自动发现和修复代码中的安全漏洞。Aardvark通过不间断地分析源代码仓库,识别漏洞、评估可利用性、划分严重等级,提出针对性修复方案。

盈标问天 – 星舰智能推出的AI招投标智能助手

盈标问天是星舰智能科技推出的招投标行业智能助手。通过AI技术,为招投标流程提供智能化解决方案,提升效率和合规性。能自动提取关键信息并深度审核50余项子项,提示风险并生成标准化报告;AI智能助手可实时解答政策和条款问题,提供法规依据

Emu3.5 – 智源研究院推出的多模态世界大模型

Emu3.5(悟界·Emu3.5)是智源研究院发布的多模态世界大模型。通过在超过10万亿多模态Token(主要源自互联网视频,总时长约790年)上进行端到端预训练,学习并内化了现实物理世界的动态规律,具备原生的世界建模能力。

Kimi Linear – 月之暗面开源的新型混合线性注意力架构

Kimi Linear 是月之暗面推出的新型混合线性注意力架构,专为提升大型语言模型(LLMs)在长序列任务中的效率和性能设计。核心组件 Kimi Delta Attention(KDA)通过精细化的通道级门控机制和高效的块处理算法,显著提升模型的表达能力和硬件效率。

Music 2.0 – MiniMax推出的新一代音乐创作模型

Music 2.0 是MiniMax最新推出的先进音乐创作模型。模型能精准捕捉和还原人声的细腻情绪与器乐的动态张力,支持多种唱法和风格切换,如流行、爵士、摇滚等,还能实现男女对唱、阿卡贝拉等效果。

Gambo – AI游戏开发Agent,一句话生成完整游戏

Gambo 是创新的 AI 游戏开发Agent,定位“世界首个 Game Vibe Coding Agent”。用户只需通过简单的文字描述,能快速生成完整的游戏,包括场景、角色、音效和交互逻辑。

Firefly Image 5 – Adobe推出的最新图像生成模型

Firefly Image 5 是 Adobe 发布的最新图像生成模型。具备原生400万像素输出能力,能直接生成高分辨率图像,细节表现力大幅提升。在人物渲染方面,新模型优化了面部结构、肢体比例和光影逻辑,减少了常见问题,使生成的人物图像更加逼真。

Composer – Cursor推出的自研编码模型

Composer 是Cursor推出的自研编码模型,专为低延迟的智能体式编码设计。模型生成速度极快,每秒可达 250 个 token,是同等智能模型的 4 倍,大多数任务在 30 秒内完成。

Speech 2.6 – MiniMax推出的语音生成模型

Speech 2.6 是MiniMax推出的全新语音生成模型,专为新一代语音智能体设计,具备超低延时(低于250毫秒),确保实时对话流畅;支持多种语言的网址、邮箱、电话号码等非标准文本格式的直接转换,无需繁琐预处理。

FIBO – 开源的图像生成模型,首个原生支持JSON

FIBO 是首个开源的、原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、可重复地控制光线、构图、色彩与相机参数。

SoulX-Podcast – Soul推出的多说话人语音合成模型

SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川话、河南话、粤语等),具备跨方言提示功能,可通过普通话提示生成目标方言语音。

Agent HQ – GitHub推出的集成AI智能体平台

Agent HQ是GitHub推出的集成AI智能体的创新平台,将各种AI工具无缝融入开发者的工作流中。通过Mission Control提供统一的指挥中心,让开发者可以在GitHub网站、VS Code、移动端或命令行界面中轻松分配、指导和跟踪多个AI智能体的任务。

GigaBrain-0 – 开源VLA具身模型,基于世界模型生成的数据

GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了跨任务泛化能力。采用 RGB-D 输入建模,增强了空间感知能力,通过具身思维链(Embodied CoT)监督,强化了模型在任务执行中的推理能力。

FlowithOS – Flowith推出的首个智能体操作系统

FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件管理、游戏操作等。

Pomelli – Google Labs推出的AI营销工具

Pomelli 是 Google Labs 推出的 AI 营销工具。用户输入品牌网站地址,Pomelli 能在短时间内分析网站的配色、风格等元素,自动生成符合品牌调性的营销文案和图片素材。工具具备局部编辑和二次编辑功能,方便用户对生成内容进行优化调整。

Remy – AI 3D模型生成应用,支持360度自由环视

Remy 是Kiri Innovations公司推出的基于3D高斯溅射技术的空间记录应用,用户可通过手机拍摄视频快速生成逼真的3D场景。应用随华为鸿蒙OS 6系统发布,上线后迅速登顶鸿蒙应用商店下载榜,支持沉浸式探索模式和跨设备分享。

Mistral AI Studio – Mistral AI推出的企业级AI应用开发平台

Mistral AI Studio 是法国 AI 初创公司 Mistral AI 推出的企业级 AI 应用开发平台,帮助企业将 AI 从原型开发过渡到可靠、可扩展的生产系统。具备三大核心功能:深度可观察性(Observability),提供全面的 AI 应用运行监控与改进能力

Hailuo 2.3 – MiniMax推出的AI视频生成模型

Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加流畅自然且复杂的动态画面,支持多种画风,如动漫、水墨等。模型对运动指令的响应更加精准,画面效果接近实拍。

Grokipedia – xAI推出的新型AI知识平台

Grokipedia是埃隆·马斯克旗下人工智能公司xAI开发的新型知识平台。基于xAI的Grok AI系统构建,通过AI技术修正知识库中的信息并补充背景。Grokipedia的核心亮点是融合了Grok AI聊天机器人,能对平台内容进行自动筛查与错误纠正。

Sky – Shortcuts推出面向Mac的AI自动化工具

Sky是Shortcuts团队推出的AI驱动的自动化工具,专为Mac设计。工具支持与任何窗口和任何应用程序进行交互,基于自然语言处理和AI技术,帮助用户快速完成任务。