AI项目
Caesr – AI自动化Agent,模拟人类操作设备
Caesr是智能自动化工具,能在电脑、手机和网页环境中像人类一样操作设备。工具通过视觉识别、点击按钮、填写表单等方式完成任务,无需依赖API或复杂脚本。Caesr主要功能包括端到端软件测试、数据输入与处理、重复性行政任务自动化等,支持多种操作系统和设备。
Gemini Enterprise – 谷歌推出的企业级AI Agent平台
Gemini Enterprise 是 Google Cloud 推出的企业级 AI 平台,通过直观的聊天界面将 Google 顶尖的 AI 技术融入企业工作流程。平台能连接企业所有数据、工具和团队,简化复杂工作流程,支持从市场研究到自动生成内容的多场景应用。
Jamba Reasoning 3B – AI21开源的轻量级推理模型
Jamba Reasoning 3B 是 AI21 Labs 推出的轻量级高效推理模型,拥有 30 亿参数和 256K 的超长上下文处理能力。模型用混合 Transformer-Mamba 架构,结合注意力机制和状态空间模型的优势,具备高效推理、低延迟的特点。
Oreate AI – 全能AI工作空间,生成报告、论文、方案、演示
Oreate AI 是面向学生、学者和研究人员的 AI 工具,专注于快速生成幻灯片、报告和论文等文档。支持多种文档类型,如商业提案、学术研究和营销计划等,能一键生成专业的演示文稿和研究报告,能自动添加引用来源,支持 APA、MLA 和芝加哥等多种引用格式。
Snapdeck – 免费AI PPT生成工具,能在画布中精细调整
Snapdeck是AI驱动的PPT生成工具,能在几秒钟内根据用户输入的主题或要点自动生成包含专业设计的幻灯片。支持版本控制、多人协作和自然语言编辑,能在Figma画布中精细调整。相比传统工具,Snapdeck能将制作PPT的时间从3-4小时压缩到几分钟
Gaga – AI视频生成平台,专注生成影视级人物表演
Gaga 是 Sand.AI 团队推出的 AI 视频生成平台,专注于音画同步的人物表演。用户只需上传一张照片输入台词,Gaga 能在几分钟内生成带有声音、表情和情绪的视频,效果接近影视级别。
Ling-1T – 蚂蚁集团开源的大型语言模型
Ling-1T 是蚂蚁集团开源的万亿参数语言模型,定位为“旗舰级非思考模型”。基于 MoE(Mixture of Experts)架构,拥有 1 万亿参数,每次推理激活约 510 亿参数,支持 128K 上下文长度,适合处理长文档任务。
Gemini 2.5 Computer Use – 谷歌推出的计算机使用模型
Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的计算机使用模型。模型能让 AI 直接控制浏览器,执行点击、滚动和输入等操作。
CodeFlicker – 快手推出的AI原生IDE
CodeFlicker是快手推出的AI原生集成开发环境。是一款智能代码编辑器,具备多项先进功能。支持AI问答和代码自动补全,能理解开发者的问题并提供智能的代码建议。其CodeFlicker引入了基于Agent的AI编程,可以像人类程序员一样理解和执行复杂的编程任务,实现端到端的开发,从需求到代码生成能自动化完成。
DeepScientist – 西湖大学推出的全自动AI科学家系统
DeepScientist 是西湖大学等机构提出的自主科研系统,实现从假设生成到实验验证、再到结果分析与论文撰写的全流程自动化。通过多智能体架构与强化学习策略,使人工智能能在无人干预的情况下不断探索、验证并推进科学前沿。
NatAgent – AI数据情报监控与分析平台
NatAgent 是基于自然语言的 AI 数据情报监控与分析平台,专注于通过智能化技术帮助用户高效提取、监控和分析各类网络数据,从中获取可操作的洞察。核心功能包括智能监控,实时追踪网页、社交媒体、电商平台等内容变化并推送警报
CodeMender – DeepMind推出的代码修复AI Agent
CodeMender是DeepMind推出的是基于 Gemini Deep Think 模型的 AI 代理工具,专注于自动识别和修复软件中的关键安全漏洞。采用被动响应与主动防御相结合的方式,能立即修补新发现的漏洞,能重写和保护现有代码以消除系统性漏洞。
Juicebox – AI招聘平台,精准匹配岗位需求
Juicebox 是领先的AI招聘平台,通过AI技术优化招聘流程。平台能从海量数据中自动筛选出符合条件的候选人,通过智能算法精准匹配岗位需求。
Mew Design – AI设计工具,自然语言生成视觉设计作品
Mew Design是创新的AI设计工具,用户通过自然语言描述能快速生成专业的视觉设计作品。工具支持多种设计类型,如社交媒体帖子、海报、传单等,满足个人和企业的多元需求。
SceneGen – 上海交大推出的3D场景生成框架
SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发,通过一次前向传播,直接生成包含完整几何结构、纹理和空间布局的3D场景。创新之处在于端到端的生成流程,无需依赖耗时的优化过程或从资产库中检索组装,显著提升了生成效率。
Code2Video – 国立大学推出的AI教学视频生成框架
Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责将知识点转化为结构化故事板,Coder将故事板转为可执行Manim代码,Critic优化视觉布局。
Auralix – AI学习工具,语音互动讲解笔记内容
Auralix 是创新的 AI 语音辅导工具,通过实时语音互动帮助用户高效学习。工具支持将学习材料转化为清晰的笔记,通过 AI 教练进行一对一的语音辅导,支持打断提问、即时反馈和个性化测验。
UntitledPen – AI语音生成平台,自由选择定制声音
UntitledPen 是AI语音生成平台,能将文字快速转换为自然流畅的语音,支持多种语言和语音风格,提供智能写作、语音定制、音频编辑等功能。
Ming-UniAudio – 蚂蚁集团开源的音频多模态模型
Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语音分词器,能有效整合语义和声学特征。基于此,Ming-UniAudio 开发了一个端到端的语音语言模型,平衡了生成和理解能力,并通过扩散头确保高质量的语音合成。
Agent Kit – OpenAI推出的AI Agent开发工具
Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,支持拖拽节点设计复杂工作流,无需从零编写代码
粤公网安备 123456789号