AI项目

LensGo AI – AI内容创作平台,一键生成风格化图像与视频

LensGo AI 是创新的 AI 创作平台,支持将简单的文字提示、照片或原始视频素材转化为风格化的图像和视频内容。平台通过强大的多模式创作引擎,让用户在浏览器中轻松实现从文字到视觉、从静态到动态的快速转换,无需复杂的剪辑或动画技能。

Gemini TTS – 谷歌推出的最新文字转语音模型

Gemini TTS 是谷歌推出的先进文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。支持多说话人、多语言(24种以上)合成,可生成自然流畅且富有情感的语音。用户可通过自然语言指令精确控制语音的风格、语速、语调和情感表达。

LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型

LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型(dLLM),包含 16B(mini)和 100B(flash)两个版本。打破了扩散模型难以扩展的瓶颈,首次将参数规模扩展至 100B 量级。

Claude-Mem – 开源Claude Code记忆插件,提供长期记忆

Claude-Mem 是专为 Claude Code 设计的开源插件,能为 AI 提供长期记忆能力。Claude-Mem通过自动存储和管理会话中的关键信息,包括工具调用、对话记录和项目结构,解决 AI 在跨会话中容易遗忘的问题。

LuxReal – 群核科技推出的AI 3D视频创作平台

LuxReal 是群核科技推出的 AI 3D视频创作平台。平台能基于图像、3D 模型等多模态输入,快速生成主体一致、画面可控的视频内容,适用电商、影视、广告等行业。L

SSVAE – 智谱AI开源的频谱结构化变分自编码器

SSVAE(Spectral-Structured VAE)是智谱AI推出的优化视频生成的新型变分自编码器。SSVAE通过谱分析发现,视频 VAE 的隐空间若具备时空低频偏置和通道特征值的少模式偏置,能显著加速下游扩散模型的训练。

GWM-1 – Runway推出的首个通用世界模型

GWM-1 是 Runway 推出的首个通用世界模型,基于 Gen-4.5 构建,采用自回归架构逐帧预测视频内容,可实时交互。模型分为三个分支:GWM Worlds 用于实时环境模拟,生成沉浸式、无限可探索空间;GWM Avatars 是音频驱动的交互视频生成模型,模拟自然人类动作和表情;GWM Robotics 是机器人训练模拟器,生成合成数据加速机器人开发。

DeepSearchQA – 谷歌开源的AI研究Agent测试基准

DeepSearchQA是谷歌开源的新基准测试工具,用于评估Agent在网络研究任务中的全面性和多步查询能力。工具包含17个领域共900个手工设计的“因果链”任务,每一步都依赖于先前分析。

GPT-5.2 – OpenAI最新推出的通用AI模型系列

GPT-5.2 是 OpenAI 最新发布的先进人工智能模型系列,专为专业工作和复杂任务设计。模型提供三种版本:GPT-5.2 Instant 适用快速处理日常任务,如信息查询和翻译,GPT-5.2 Thinking 专为复杂任务优化,如编程、长文档处理和多步骤项目管理,GPT-5.2 Pro 专注于高难度任务,提供高精度和高可靠性,适合科学研究和复杂分析。

Dynal.AI – 专注于LinkedIn内容创作的AI Agent助手

Dynal.AI 是专注于LinkedIn内容创作的智能工具,帮助用户高效生成和管理高质量的LinkedIn帖子。通过AI技术,将文字稿、网站链接、视频、PDF文件等素材快速转化为适合LinkedIn的帖子内容,抓取重点并调整语气,实现内容的高效再利用。

GLM-TTS – 智谱开源的工业级语音合成系统

GLM-TTS 是智谱推出的基于多奖励强化学习的工业级语音合成系统,具备音色复刻、多情感表达、高精度文本理解和高质量语音输出等功能。

AutoDL算力云 – AI算力服务平台,提供多种主流GPU型号

AutoDL算力云是专注于提供高效、灵活且经济实惠的GPU算力租赁服务的AI平台,主要面向人工智能和深度学习领域的开发者、研究人员以及企业用户。支持多种主流GPU型号,如NVIDIA RTX系列、A100、H800等,满足从入门级到大规模模型训练的不同需求。

OfferNow – AI简历自动填写助手,覆盖众多求职平台

OfferNow 是智能简历填写助手,工具通过 AI 技术实现简历的自动填写,AI 智能识别,能精准识别简历信息并快速填充;数据安全加密,确保用户信息在填写过程中的安全;支持千万网站,覆盖众多求职平台,方便用户在不同网站上使用

Mistral Vibe CLI – Mistral AI推出的开源命令行代码助手

Mistral Vibe CLI 是Mistral AI 推出的开源命令行代码助手,能通过自然语言交互帮助开发者高效完成代码任务。Mistral Vibe CLI 能自动感知项目结构和 Git 状态,提供精准的上下文支持,让开发者能轻松地对代码进行搜索、修改和执行操作。

疯火轮AI – AI营销智能体平台,对话式完成内容创作

疯火轮AI(Madfire AI)是专家级AI营销智能体平台,能为用户提供多种智能服务,包括社媒热点策划、营销方案设计、公关改稿、会议纪要整理、视频分析、小红书内容创作、神评论分析和行业研究等。

Vora – AI视频生成器,生成高清、无水印Sora视频

Vora是一款增强Sora视频的AI视频生成器,帮助用户更好的生成Sora视频,同时节约时间和金钱。Vora支持通过文本描述或图片,创建带声音、高清无水印的Sora视频,没有生成次数限制。内置实用创作工具,支持即时去除Sora水印并进行清晰无损的视频增强。

Vidyard – AI营销视频生成平台,高效视频创作与精准推送

Vidyard 是创新的 AI 营销视频生成平台,平台通过个性化视频消息帮助销售人员突破传统沟通的局限,快速建立与客户的深度连接,提升销售转化率。借助强大的 AI 技术,Vidyard 能实现视频内容的高效创作和精准推送,让每一次互动都更具影响力。

Strater AI – AI学习工具,一键将视频、文档转为学习资料

Strater AI 是高效的AI学习工具,基于AI技术将 YouTube 视频、PDF 文档和网页文章转化为结构化的学习资料,如摘要、测验、记忆卡片和思维导图。

Questas – AI互动故事创作平台,自动生成匹配的视觉内容

Questas 是AI 驱动的互动故事创作平台,用户能通过文字描述生成匹配场景的图像和视频。平台支持复杂的分支叙事结构,让每个选择都引导不同的剧情走向。

Piktochart – AI设计工具,文字生成多类型视觉内容

Piktochart 是强大的 AI 设计工具,专为快速创建视觉内容设计。工具支持生成信息图表、视频、社交媒体图像、演示文稿等多种素材,无需设计经验。