AI项目
Next Music – AI音乐创作平台,一键生成原创音乐和歌词
Next Music 是创新的AI音乐创作平台,能帮助用户快速生成原创音乐和歌词。用户只需描述歌曲的风格和主题,平台能在短时间内生成完整的歌曲。平台支持选择音色性别、自定义歌词等功能,非常适合音乐新手和创作者。
课游记AI – AI个性化学习平,定制专属学习内容
课游记AI是面向中小学师生的AI个性化学习平台,输入主题即可秒级生成课程大纲、教案、动画视频与练习题,覆盖语数英、科学、编程等学科。平台自研教育大模型,支持学生按兴趣定制角色与场景,实现“一人一课程”的沉浸式学习;教师可一键输出高质量备课素材,节省80%教案时间。
Maya1 – Maya Research团队开源的语音生成模型
Maya1 是 Maya Research 团队推出的开源语音模型,专为生成富有情感的语音而设计。模型通过自然语言描述来设计声音,支持 20 多种情绪表达,如大笑、哭泣、叹气等,能实时流式传输音频。
Step-Audio-EditX – 阶跃星辰开源的音频编辑大模型
Step-Audio-EditX 是阶跃星辰开源的全球首个 LLM 级音频编辑大模型,主打“情感、说话风格、副语言”三轴细粒度迭代控制,可把愤怒、开心、悲伤等情绪强度任意增减,能把撒娇、耳语、老人等风格叠加多次,能像字幕一样插入呼吸、笑声、叹气等 10 类自然副语言 token。
Comfy Cloud – ComfyUI推出的云端AI创作平台
Comfy Cloud是ComfyUI团队推出的云端AI创作平台,允许用户通过浏览器直接运行ComfyUI工具,无需本地安装显卡或配置环境。采用NVIDIA A100 40GB GPU提供算力支持,预置400+开源模型和17款热门扩展,涵盖Stable Diffusion、SDXL等主流AI工具链。
Flova.ai – 一站式AI视频创作平台,对话式创作
Flova.ai 是创新的 AI 视频创作平台,通过自然对话的方式,将用户的创意转化为完整的视频作品。用户只需输入一个核心概念,平台上的 AI 团队(包括编剧、导演、视觉设计师等)会迅速生成脚本、画面、音乐等元素,形成初步的视频初稿。
MOOME – 沉浸式AI扮演游戏,自创多元虚拟角色
MOOME是沉浸式AI扮演游戏,用户能自创或邂逅多元虚拟角色,进行24小时不间断的语音、文字与剧情化互动,AI会记住每一次喜怒哀乐,提供持续、私密且逐渐深化的情感支持。
Medo – 百度推出的无代码AI应用开发平台,秒哒海外版
Medo 是百度推出的无代码AI应用开发平台,秒哒的海外版。帮助用户无需编写代码即可快速创建各种应用程序。通过其可视化界面和丰富的组件库,用户可以轻松搭建从游戏到电商网站、从教育平台到工具类应用的多种项目。
Kimi-k2 Thinking – 月之暗面推出的思考模型
Kimi-k2 Thinking 是月之暗面推出的具备通用 Agentic 能力和深度推理能力的人工智能模型。模型能进行多轮工具调用,支持长达 256k 的上下文处理,适合复杂任务的逐步推理和规划。
Open-o3 Video – 北大联合字节开源的视频推理模型
Open-o3 Video 是北京大学和字节跳动联合开发的开源视频推理模型,通过整合显式的时空证据(关键时间戳和边界框)来实现精准的视频推理。通过精心策划的 STGR 数据集和两阶段的 SFT-RL 训练策略,实现了在 V-STAR 基准测试中的最佳性能。
讯飞星火X1.5 – 科大讯飞推出的深度推理大模型
讯飞星火X1.5 是科大讯飞推出的基于全国产算力平台的深度推理大模型。模型率先攻克 MoE 模型全链路训练效率问题,端到端性能达到国际竞品效率的 93% 以上。模型在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等多领域对标国际主流大模型,数学能力保持国际领先水平。
UniWorld V2 – 兔展智能联合北大推出的图像编辑模型
UniWorld V2是兔展智能和北京大学UniWorld团队推出的新一代图像编辑模型。采用创新的UniWorld-R1训练框架,首次将强化学习策略优化应用于图像编辑,通过DiffusionNFT技术实现高效训练。模型使用多模态大语言模型作为奖励模型,提供稳定且细粒度的反馈,同时引入低方差组过滤机制,提升训练稳定性。
TapNow – AI视觉内容创作平台,提供多种预设工作流
TapNow 是 AI 视觉内容创作平台,通过集成多种先进的图像和视频生成模型,提供丰富的预设工作流,用户只需上传素材、选择对应工作流,能快速生成高质量的创作内容,如广告图、动态场景、拟真手办等。
Handy – 开源的语音转文字桌面应用,完全离线
Handy 是开源的语音转文字桌面应用,完全离线运行,支持 Windows、macOS 和 Linux 系统。由 Rust 和 React/TypeScript 构建,界面简洁,操作便捷。用户通过快捷键激活录音,语音经本地处理后直接转为文本,无需联网,保护隐私。
NavFoM – 银河通用推出的环视导航基座大模型
NavFoM(Navigation Foundation Model)是银河通用联合北京大学、阿德莱德大学、浙江大学等团队发布的全球首个跨本体全域环视导航基座大模型。具备全场景支持能力,可同时适用于室内和室外环境,能在未见过的场景中实现零样本运行。
FG-CLIP 2 – 360开源的双语细粒度视觉语言对齐模型
FG-CLIP 2是360推出的开源双语细粒度视觉语言对齐模型,专为解决视觉与语言的精准对齐问题而设计。在视觉语言理解领域取得了重大突破,尤其在中英文双语任务上表现出色。模型采用层次化对齐架构,通过全局语义对齐和细粒度视觉语言学习,逐步提升模型对图像细节的理解能力。
Ouro – 字节Seed推出的循环语言模型
Ouro是字节跳动Seed团队联合多家机构发布的循环语言模型(Looped Language Models,LoopLM)。名称源于象征循环与自我吞噬的“衔尾蛇”(Ouroboros)。Ouro模型通过在潜在空间中进行迭代计算,将推理能力直接构建到预训练阶段,非仅依赖后期微调。
MoArk AI – 模力方舟推出的国际化AI云平台
MoArk AI 是模力方舟的国际站,面向全球 AI 开发者和企业的 AI 云平台,提供标准化、模块化、可控可扩展的服务。MoArk.ai 的核心功能包括 Serverless 推理服务,用户无需配置 GPU,可开箱即用,毫秒级响应,支持企业级 VPC 隔离部署,符合 SOC 2 与 HIPAA 合规要求。
Open AgentKit – 零一万物开源的AI Agent开发平台
Open AgentKit(OAK)是零一万物开源的AI Agent开发平台,能为开发者提供开放、通用的Agent开发解决方案。平台受OpenAI AgentKit启发,支持多种模型和生态系统工具,集成行业最佳实践,遵循主流Agent协议与标准。
Huebit AI – AI艺术创作平台,支持多种风格和主题
Huebit AI 是创新的人工智能艺术平台,将人工智能与艺术创作相结合。用户可以通过简单的文字描述或上传图片,让 AI 快速生成个性化的艺术作品。平台支持多种艺术风格和主题,从抽象画到写实风格,都能轻松实现。
粤公网安备 123456789号