AI项目

PixVerse C1 – 爱诗科技推出的全球首个影视行业大模型

PixVerse C1是爱诗科技推出的全球首个影视行业大模型,支持文生/图生/参考生/首尾帧视频生成,最高输出15秒1080P音画同步视频。模型首创多宫格智能分镜功能,可一键将分镜图转为连续成片。

GLM-5.1 – 智谱AI开源的旗舰大模型

GLM-5.1是智谱AI开源的旗舰大模型,是目前全球最强开源模型。模型代码能力在SWE-Bench Pro基准测试中位列全球第一,超越GPT-5.4和Claude Opus 4.6。

LLM Wiki – Karpathy开源的自运行个人知识库

LLM Wiki是Karpathy推出的自主运行的个人知识库,突破传统RAG"每次查询从零检索"的局限。LLM Wiki通过Schema文件指导LLM主动维护结构化Markdown Wiki,将原始资料"编译"为带交叉引用、矛盾标注的持久化知识体。

EmDash – Cloudflare开源的 AI 原生内容管理系统

EmDash是Cloudflare推出的AI原生内容管理系统,定位为WordPress的继承者。EmDash采用TypeScript+Serverless架构,支持AI代理直接操作网站,数据以结构化JSON存储,插件运行在独立沙箱中更安全。

MAI-Transcribe-1 – 微软推出的语音转文字模型

MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型,支持中英日法等25种语言,模型在FLEURS基准测试中全面领先Whisper-large-v3。

Wan2.7-Video – 阿里通义推出的 AI 视频创作模型

Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型,支持文本、图像、视频、音频全模态输入。模型突破传统生成限制,实现"像修图一样修视频"的局部编辑、台词动作调整、运镜复刻、剧情续写等全流程创作。

Gemma 4 – 谷歌开源的多模态大模型系列

Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense(Arena评分开源第三)四个版本。

Pada – AI角色聊天平台,支持多模态互动体验

Pada 是原问小白App 升级后的 AI 角色聊天平台。定位「AI 角色聊天与共创宇宙」,提供丰富的虚拟角色、沉浸式对话及多模态互动体验,主打与 AI 角色的情感陪伴与故事共创。

claw-code – 开源的 Claude Code 源码重写项目

claw-code 是Claude Code 源码泄露后推出的Clean-room Rewrite项目。作者为避免法律风险,使用 OpenAI Codex 的 OmX 工作流编排,仅用数小时将核心架构从 TypeScript 移植为 Python 实现。

ClawHub镜像站 – OpenClaw推出的中国官方镜像站点

ClawHub镜像站是OpenClaw推出的中国官方镜像站点,由字节跳动BytePlus与火山引擎提供基础设施支持。网站持续收录、加速ClawHub社区的高质量Agent Skill,解决国内访问原站速度慢的问题。

叽伴 – 趣丸旗下推出的 AI 情感陪伴应用

叽伴是趣丸旗下上海小煎饼科技推出的AI情感陪伴应用,主打"真实羁绊"。应用AI角色具备长期记忆,能记住你们的每一次冒险和建议,主动写手帐、寄信、送礼物,随陪伴不断成长变化。

updream – B 站推出的 AI 视频创作助手

updream是B站官方推出的专业级AI视频创作助手,专为资深UP主打造。核心功能包括AI智能Agent、个性化技能库与自由创作画布,具备长期深度记忆能力,可持续学习创作者风格并沉淀为可复用技能。

GLM-5V-Turbo – 智谱AI推出的原生多模态Coding基座模型

GLM-5V-Turbo是智谱AI推出的原生多模态Coding基座模型,专为视觉编程和AI Agent设计。模型从预训练阶段深度融合视觉与文本能力,支持理解图片、视频、设计稿等多模态输入,上下文窗口达200k。

小精龙 – 学而思推出的学生私人 AI 学伴 Agent

小精龙是学而思推出的面向学生的AI智能学伴(Agent),基于OpenClaw架构打造。工具通过"大脑映射"持续理解学生的知识漏洞与思维习惯,将学习轨迹沉淀为"私有财产"(越用越懂学生),用"学习伴侣"身份提供个性化辅导与情感陪伴。

天工短剧工作台 – 昆仑万维推出的 AI 短剧创作平台

天工短剧工作台是昆仑万维推出的AI短剧创作平台,基于多Agent协同,整合Seedance、可灵等全球顶尖视频模型。平台支持传统与智能分镜双模式,通过资产提取Agent、导演Agent自动拆解剧本生成导演级视频,运用多视图推理技术保障角色一致性。

Vision2Web – 清华联合智谱AI推出的视觉网站开发评估基准

Vision2Web是清华大学和智谱AI联合推出的视觉网站开发评估基准,用于评估多模态AI Agent的端到端建站能力。Vision2Web包含193个真实网站任务,分为三层递进难度:静态网页生成、交互式前端开发、全栈网站构建。

PixVerse V6 – 爱诗科技推出的最新 AI 视频生成模型

PixVerse V6 是爱诗科技推出的最新 AI 视频生成模型。模型在镜头控制、角色表现和多镜头音视频生成方面实现突破,运镜更精准,角色情绪跨帧连贯,物理交互更真实,生成时长最长可达 15s;支持单提示词生成带原生音频的多镜头短片,无需后期剪辑。

Pretext – 开源 AI 前端开发工具,解决中文字布局性能瓶颈

Pretext 是前 React 核心成员 Cheng Lou 开源的,纯 JavaScript/TypeScript 的多行文本测量与布局库,用于纯算术方式精确测量多行文本尺寸,完全绕过 DOM 重排。

Multi-Shot – Runway 推出的 AI 视频生成应用

Multi-Shot 是 Runway 推出的 AI 视频生成应用,支持实现"一键成片"。用户只需输入场景描述,系统自动拆解为最多5个连贯镜头,同步完成构图、运镜、对话、音效和剪辑,直接输出电影感短片。

Qwen3.5-Omni – 阿里通义推出的全模态大模型

Qwen3.5-Omni 是阿里通义实验室推出的全模态大模型,可同时理解文本、图像、音频及音视频输入。模型采用Thinker-Talker分工架构与Hybrid-MoE技术,在215项音频/音视频任务中取得SOTA成绩,超越Gemini-3.1 Pro。