AI 视频 (智能成片) 产品架构设计
1. 产品定位与目标
定位:专为酒店行业打造的“零门槛”智能视频剪辑与包装引擎。 目标:解决酒店从业者(如前台、销售)缺乏专业剪辑技能、视频制作耗时过长的问题。用户只需上传零散的客房/活动素材,系统即可自动识别、卡点、混剪,并添加符合酒店调性的字幕、音乐和转场。
2. 核心场景支持 (Scenarios)
- 客房展示 (Showcase):突出空间感与设施,节奏平稳,配以优雅音乐。
- 活动预告 (Event Preview):突出氛围感,快闪节奏,配以动感音乐。
- 美食探店 (Food):突出细节特写与色彩,温馨治愈节奏。
3. 技术架构与数据流 (Technical Architecture)
3.1 核心链路
- 素材上传 (Upload):前端
SmartUploader将用户的图片/视频直传至企业 OSS 素材库,返回oss://格式的 URL 列表。 - 任务组装 (Payload Assembly):将选中的素材列表、视频时长(15s/30s/60s)、风格(StyleId)组装为标准请求体。
- 服务派发 (Dispatch):后端调用阿里云 IMS (Intelligent Media Services) 的
SubmitMediaProducingJob接口,提交智能混剪任务,获取JobId。 - 异步轮询 (Polling):前端通过
useAigcPolling钩子,每隔 3 秒向后端请求JobId的状态。 - 防盗链渲染 (Anti-leeching):任务完成后,后端返回受保护的 OSS 视频地址,前端调用
getSignatureUrl换取带有 STS 签名的临时 URL,注入<video>标签播放。
3.2 阿里云 IMS 脚本模板策略 (Timeline Strategy)
针对不同场景,预设不同的 Timeline 脚本配置:
- VideoTrack:自动应用
Transitions(如淡入淡出、黑场过渡),并开启SmartCrop(智能裁切)以适配 9:16 竖屏。 - AudioTrack:根据风格挂载特定的 BGM,并应用
AudioFade(音频淡入淡出)防止爆音。 - SubtitleTrack:若勾选了文案生成,将 AI 生成的解说词合成为 TTS 语音,并自动生成动态字幕。
4. 容错与优雅降级 (Graceful Degradation)
- 素材质量校验:若上传的素材总时长小于目标生成时长(如传了 5 秒素材要求生成 15 秒视频),前端拦截并提示补充素材。
- 轮询超时兜底:若超过 3 分钟(
maxAttempts: 60)未返回成功,前端中止轮询,提示“云端排队中,视频将在后台继续合成,请稍后在历史记录中查看”。 - 渲染失败回退:若 IMS 返回素材格式不支持,提供“跳转高级编辑器”或“更换素材”的快捷入口。