AI项目

Gemini 2.5 Computer Use – 谷歌推出的计算机使用模型

Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的计算机使用模型。模型能让 AI 直接控制浏览器,执行点击、滚动和输入等操作。

CodeFlicker – 快手推出的AI原生IDE

CodeFlicker是快手推出的AI原生集成开发环境。是一款智能代码编辑器,具备多项先进功能。支持AI问答和代码自动补全,能理解开发者的问题并提供智能的代码建议。其CodeFlicker引入了基于Agent的AI编程,可以像人类程序员一样理解和执行复杂的编程任务,实现端到端的开发,从需求到代码生成能自动化完成。

DeepScientist – 西湖大学推出的全自动AI科学家系统

DeepScientist 是西湖大学等机构提出的自主科研系统,实现从假设生成到实验验证、再到结果分析与论文撰写的全流程自动化。通过多智能体架构与强化学习策略,使人工智能能在无人干预的情况下不断探索、验证并推进科学前沿。

NatAgent – AI数据情报监控与分析平台

NatAgent 是基于自然语言的 AI 数据情报监控与分析平台,专注于通过智能化技术帮助用户高效提取、监控和分析各类网络数据,从中获取可操作的洞察。核心功能包括智能监控,实时追踪网页、社交媒体、电商平台等内容变化并推送警报

CodeMender – DeepMind推出的代码修复AI Agent

CodeMender是DeepMind推出的是基于 Gemini Deep Think 模型的 AI 代理工具,专注于自动识别和修复软件中的关键安全漏洞。采用被动响应与主动防御相结合的方式,能立即修补新发现的漏洞,能重写和保护现有代码以消除系统性漏洞。

Juicebox – AI招聘平台,精准匹配岗位需求

Juicebox 是领先的AI招聘平台,通过AI技术优化招聘流程。平台能从海量数据中自动筛选出符合条件的候选人,通过智能算法精准匹配岗位需求。

Mew Design – AI设计工具,自然语言生成视觉设计作品

Mew Design是创新的AI设计工具,用户通过自然语言描述能快速生成专业的视觉设计作品。工具支持多种设计类型,如社交媒体帖子、海报、传单等,满足个人和企业的多元需求。

SceneGen – 上海交大推出的3D场景生成框架

SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发,通过一次前向传播,直接生成包含完整几何结构、纹理和空间布局的3D场景。创新之处在于端到端的生成流程,无需依赖耗时的优化过程或从资产库中检索组装,显著提升了生成效率。

Code2Video – 国立大学推出的AI教学视频生成框架

Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责将知识点转化为结构化故事板,Coder将故事板转为可执行Manim代码,Critic优化视觉布局。

Auralix – AI学习工具,语音互动讲解笔记内容

Auralix 是创新的 AI 语音辅导工具,通过实时语音互动帮助用户高效学习。工具支持将学习材料转化为清晰的笔记,通过 AI 教练进行一对一的语音辅导,支持打断提问、即时反馈和个性化测验。

UntitledPen – AI语音生成平台,自由选择定制声音

UntitledPen 是AI语音生成平台,能将文字快速转换为自然流畅的语音,支持多种语言和语音风格,提供智能写作、语音定制、音频编辑等功能。

Ming-UniAudio – 蚂蚁集团开源的音频多模态模型

Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语音分词器,能有效整合语义和声学特征。基于此,Ming-UniAudio 开发了一个端到端的语音语言模型,平衡了生成和理解能力,并通过扩散头确保高质量的语音合成。

Agent Kit – OpenAI推出的AI Agent开发工具

Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,支持拖拽节点设计复杂工作流,无需从零编写代码

TextWell – AI写作辅助工具,从不同角度进行优化

TextWell是AI写作辅助工具,能提升文档质量与吸引力,通过模拟AI评审团,从不同角度对文档进行批评和建议,帮助用户优化内容。

OpenLens AI – 清华推出的医学研究AI助手

OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流程自动化,极大提升医学研究效率,将科研周期从“月级”缩短至“小时级”。

ReceiptHero – 开源AI记账工具,拍照生成数字化账单

ReceiptHero 是开源的 AI 记账工具,能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术,用高达 95% 的准确率提取收据上的日期、金额、商户名称等关键信息,支持自动对支出进行智能分类,如餐饮、交通等。

Dreamer 4 – DeepMind推出的新型世界模型智能体

Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)游戏中,Dreamer 4 仅使用离线数据就成功获得了钻石,是该领域的一个重要突破。

Mano – 明略科技推出的GUI智能操作模型

Mano 是明略科技推出的专有大模型,专注于图形用户界面(GUI)智能操作。模型基于多模态基础模型,通过在线强化学习和训练数据自动采集等创新技术,在 Mind2Web 和 OSWorld 两大基准测试中取得 SOTA 成绩。

SciToolAgent – 浙大开源知识图谱驱动的科学领域Agent

SciToolAgent是浙江大学创新中心(HICAI-ZJU)开发的开源工具平台,提升科研效率。整合了500多种科学工具,覆盖生物学、化学、材料科学等多领域,可处理数据处理、分子建模、文献分析等任务。

xLLM – 京东开源的智能推理框架

xLLM 是京东开源的高效智能推理框架,专为国产芯片优化,支持端云一体部署。框架用服务-引擎分离架构,服务层负责请求调度与容错,引擎层专注运算优化,具备多流并行、图融合、动态负载均衡等特性。