AI项目
Temvideo.ai – AI视频制作Agent,专为跨境电商营销设计
Temvideo.ai 是面向商业用户的 AI 视频制作工具,通过智能算法帮助用户快速生成高质量的营销视频。用户只需提供想法和素材,AI 代理即可自动完成视频制作,包括脚本撰写、素材剪辑、配音添加等。支持多语言翻译,可将视频快速本地化,拓展全球市场。
Ito – 开源的AI语音听写工具,口语意图可转为文本
Ito是开源的智能语音听写工具,通过其独特的“VibeTyping”技术,将用户的口语意图转换为精美文本。支持在邮件客户端、文档、聊天平台、浏览器和代码编辑器等各类应用程序中使用,提供可自定义的全局键盘快捷键和即时文本插入功能。
Talo – AI实时语音翻译工具,无缝集成多主流会议平台
Talo 是先进的AI实时语音翻译工具,专为打破语言障碍设计,广泛应用于视频会议场景。支持超过60种语言的即时翻译,能无缝集成到Google Meet、Microsoft Teams和Zoom等主流视频会议平台中。用户只需将会议链接粘贴到Talo界面并选择所需语言,即可开启翻译服务。
Spokenly – 本地AI语音听写工具,自动优化语法
Spokenly 是为 Mac 和 iPhone 设计的智能语音听写应用,支持超过100种语言,具备自动语言检测功能,适合多语言用户和国际团队。提供“本地优先”模式,所有语音数据仅在本地处理,确保隐私安全。Spokenly 支持实时转录,文字随说话实时显示,用户可根据需求选择从超快速到最高准确性的多种引擎。
讯飞输入法 – 科大讯飞推出的AI输入工具
讯飞输入法是科大讯飞推出的智能输入工具,具备高精度语音识别和多样化输入方式。支持语音、拼音、手写等多种输入模式,语音输入准确率高,支持多种方言和中英混合输入,方便不同用户群体使用。
闪电说 – AI语音输入工具,自动优化口语表达
闪电说是端侧优先的AI语音输入法,主打极速响应和高效输入。工具通过本地语音模型实现毫秒级识别,无需联网,响应时间仅约0.2秒,比传统键盘打字快4倍。
StepAudio R1 – 阶跃星辰开源的原生音频推理模型
StepAudio R1 是阶跃星辰团队推出的全球首个开源原生音频推理模型。模型通过创新的模态锚定推理蒸馏(MGRD)框架,解决了传统音频模型在复杂推理中性能下降的问题,真正实现基于声学特征的深度推理。
DeepSeek-Math-V2 – DeepSeek开源的数学推理模型
DeepSeek-Math-V2 是 DeepSeek 团队推出的开源数学推理模型,能实现自我验证的数学推理。模型关注答案正确性,注重推理过程的严谨性。
Uigenius – Uigenius.top推出的AI辅助UI/UX设计工具
Uigenius是Uigenius.top推出的AI辅助UI/UX设计工具,专为设计师、产品经理及需要界面设计的人群打造。通过AI技术,将用户输入的文字描述快速转化为高保真原型,能一键导出HTML、Vue、React等前端代码,实现设计与开发的无缝衔接。
Depth Anything 3 – 字节跳动推出的视觉空间重建模型
Depth Anything 3(DA3)是字节跳动Seed团队推出的视觉空间重建模型,通过单一Transformer架构实现从任意视角的视觉输入中恢复三维空间几何结构。
Z-Image – 阿里通义推出的图像生成模型
Z-Image 是阿里通义推出的图像生成模型,具有6B参数。模型包含三个变体:Z-Image-Turbo、Z-Image-Base 和 Z-Image-Edit,分别擅长快速推理、基础开发和图像编辑。
GHOST – AI原生PPT生成工具,自动生成内容和结构
GHOST 是创新AI 原生幻灯片编辑工具,专为追求高效和简洁的用户设计。工具借助先进的 AI 技术,能迅速将用户的创意转化为完整的演示文稿,极大地缩短制作时间。
小凹语音输入法 – 智谱推出的AI语音输入工具
小凹语音输入法(AutoTyper)是智谱推出的智能AI语音输入工具,通过语音输入即可高效创作,告别繁琐打字。支持多种风格表达,可任意DIY添加风格,适用于多种场景。
Dealism – AI对话式销售Agent,自动学习优化销售技巧
Dealism 是创新的 AI 销售代理工具,专注于通过“氛围销售(Vibe Selling)”帮助企业提升销售效率和客户体验。通过分析企业的知识库、聊天记录和产品信息,学习并模仿企业独特的沟通风格,提供高度个性化的客户互动。
Supermemory – AI长期记忆提供平台,具备图结构记忆
Supermemory 是为 AI 应用提供长期记忆能力的平台。平台通过 API 为开发者提供从数据抽取、切块、嵌入、索引到检索的全管线服务,具备图结构记忆和用户画像演化能力。
Factory – AI原生软件开发平台,无缝集成多种开发环境
Factory是AI原生软件开发平台,通过智能代理(Droids)与开发者的现有工作流程深度融合,在IDE、终端和CI/CD环境中,都能无缝协助完成复杂的开发任务。平台打破了传统开发的限制,让开发者无需改变习惯借助AI的力量提升效率和质量。
FLUX.2 – Black Forest Labs开源的AI图像生成与编辑模型
FLUX.2 是 Black Forest Labs 推出的视觉智能模型,专为实际创意工作流程设计。模型支持最多 10 张图片的多图参考,生成高达 4MP 分辨率的高质量图像,具备极强的细节表现力和文本渲染能力。
ViMax – 港大开源的多智能体视频生成框架
ViMax 是香港大学数据科学实验室推出的端到端多智能体视频生成框架,支持将创意、剧本或小说自动转化为完整视频。框架整合导演、编剧、制片人和视频生成器的功能,支持 Idea2Video、Novel2Video、Script2Video 和 AutoCameo 等模式,能生成分钟级长视频并保持人物与场景一致性。
Brix – AI招聘与管理平台,人才搜索到管理一站式全流程
Brix 是AI原生全球招聘与组织管理平台,专注于通过 AI 技术革新传统招聘流程。平台拥有超过 9.6 亿的全球人才库,覆盖 200 多个国家,能实现从人才搜索、自动化触达、面试管理到入职和绩效评估的全流程自动化。
Tbox AI 浏览器 – 为内容创作和知识管理设计的AI浏览器
Tbox AI 浏览器是为创作者和知识工作者设计的智能浏览器。Tbox AI 浏览器以 AI 技术为核心,将内容创作与知识管理深度融合,通过智能辅助功能,帮助用户高效生成和发布小红书等平台的优质内容,同时将日常积累转化为创作灵感。
粤公网安备 123456789号