AI项目

NeverCap – AI转录工具,提供无限制转录服务

NeverCap 是创新的 AI 转录工具,专为需要大量音频或视频转录的用户设计。提供真正无限的转录服务,无月度分钟数限制,用户可以一次性上传多达 50 个文件,每个文件最长可达 10 小时或 5GB。

MyDetector – AI内容检测平台,精准识别AI文本和图片

MyDetector 是强大的AI在线内容检测与质量保障平台。平台能精准识别 AI 生成的文本和图片,支持多种文件格式上传,检测范围涵盖文本、图片、代码三大维度。

Bandy AI – AI电商创意生成平台,静态产品图生成动态视频

Bandy AI 是专为电商打造的智能创意平台,借助先进的 AI 技术,将产品瞬间转化为极具吸引力的视觉内容。平台提升了内容创作的效率,让品牌能够快速制作出高质量的图像和视频,满足电商平台的多样化需求。

FunctionGemma – 谷歌开源专为函数调用优化的AI模型

FunctionGemma 是谷歌开源的专注于函数调用优化的轻量化AI模型,参数量为 2.7 亿。模型基于 Gemma 3 架构,专为在手机、浏览器等端侧设备上运行而设计,能将自然语言转化为可执行的 API 动作,实现智能体与工具的高效交互。

扣子编程 – 字节跳动推出的AI应用开发平台

扣子编程是字节跳动推出的 AI 应用开发平台,通过自然语言描述需求,快速生成智能体、工作流和网页应用。平台提供开箱即用的云端开发环境,无需安装工具,支持代码编辑、实时预览和一键部署。

T5Gemma 2 – 谷歌开源的长上下文编码器-解码器模型

T5Gemma 2 是谷歌开源的新型端侧多模态长上下文编码器 - 解码器模型。模型回归优化了经典 Transformer 架构,引入绑定词嵌入和合并注意力机制等创新,参数规模有 270M - 270M、1B - 1B 和 4B - 4B 等多种版本。

MegaLLM – AI模型API聚合平台,一个API访问多个主流模型

MegaLLM 是为开发者提供统一API接口的人工智能平台,可快速接入70多个主流大语言模型(LLMs),如GPT-5、Claude、Gemini、Llama等。通过一个API密钥,让开发者能轻松调用多个模型,无需分别注册账号,大大简化开发流程,加速AI功能部署。

Kairos 3.0 – 大晓机器人开源的商业应用世界模型

Kairos 3.0(开悟世界模型3.0)是大晓机器人推出的行业首创的ACE具身研发范式、首个开源且商业应用的世界模型。

laper – AI剧本创作工具,能实时预测台词与动作

Laper 是 AI 剧本创作工具,能为编剧提供精细化的创作平台。平台支持多种剧本类型,如电影长片、短片和短视频故事,具备好莱坞标准格式的智能补全功能,可实时预测台词与动作描写。

VTP – MiniMax视频团队开源的视觉生成模型预训练框架

VTP(Visual Tokenizer Pre-training)是MiniMax视频团队开源的视觉生成模型预训练框架。框架聚焦优化视觉tokenizer,通过融合对比学习、自监督学习和重建学习等方法,从头预训练tokenizer,使生成的latent(压缩特征)更具结构化和易学性。

Gemini 3 Flash – 谷歌推出的最新AI模型,主打高速低成本

Gemini 3 Flash 是谷歌推出的高速、低成本的前沿智能模型。模型基于 Gemini 3 开发,性能显著提升,具备强大的推理能力和多模态理解能力。

A2UI – 谷歌开源Agent生成用户界面的声明式协议

A2UI(Agent-to-User Interface)是谷歌开源的基于Agent的接口协议,用于AI与用户界面之间的交互。A2UI通过AI生成的JSON描述,让客户端原生渲染交互界面,无需AI编写前端代码。

混元世界模型1.5 – 腾讯混元开源的实时交互式世界生成模型

腾讯混元世界模型1.5(HY WorldPlay 1.5)是腾讯混元团队开源的实时交互式世界生成模型。用户只需输入文字或图片,模型能快速创建专属的虚拟世界,通过键盘、鼠标或手柄自由探索。

Xiaomi MiMo Studio – 小米推出的在线AI聊天服务平台

Xiaomi MiMo Studio 是小米推出的在线 AI 聊天服务平台,用户可以在其中体验 Xiaomi MiMo-V2-Flash 模型。平台支持深度搜索和联网搜索,降低了用户体验 AI 对话服务的门槛。

MiMo-V2-Flash – 小米开源的高性能语言模型

MiMo-V2-Flash 是小米开源的高性能语言模型,具有3090亿总参数和150亿激活参数。专为智能体AI设计,采用混合注意力架构,结合滑动窗口注意力(SWA)和全局注意力(GA),窗口大小为128个token,通过可学习的注意力下沉偏置(sink bias)技术,在保持长文本性能的同时显著降低KV缓存存储量。

Molmo 2 – Ai2开源的AI视频分析模型

Molmo 2 是艾伦人工智能研究所(Ai2)推出的开源视频分析模型,专注于视频理解、指向和追踪。模型基于 Qwen 3 和 Olmo 架构,具备强大的视频分析能力,能在视频中精准定位事件、追踪多目标,生成详细字幕。

LongCat-Video-Avatar – 美团开源的数字人视频生成模型

LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和自然动态。LongCat-Video-Avatar支持多种生成模式,包括音频文本生成视频(AT2V)、音频文本图像生成视频(ATI2V)和视频续写。

Ember AI – AI交互式学习平台,提供全天候AI辅导

Ember AI 是马来西亚首个为 SPM 课程量身定制的交互式学习平台,帮助学生更高效地学习。平台提供 24/7 的 AI 辅导服务,学生可以在任何时间获得即时帮助,无论是深夜复习历史还是准备英语考试,AI 助教能提供详细的解答和指导。

88查 – 阿里巴巴推出的免费AI企业信息查询平台

88查是阿里巴巴推出的免费企业信息查询平台,为企业和个人提供全面、便捷的企业数据查询服务。用户可以通过官网、支付宝或微信小程序,以及1688 App等多种方式访问,输入企业名称即可快速获取工商信息、经营风险、知识产权等多维度数据。

GPT Image 1.5 – OpenAI最新推出的图像生成模型

GPT Image 1.5 是 OpenAI 最新推出的图像生成模型,具有更强的指令遵循能力和精准编辑功能,根据用户要求只修改指定部分,同时保持画面整体一致性。