Skip to content

AI 视频 (智能成片) 产品架构设计

1. 产品定位与目标

定位:专为酒店行业打造的“零门槛”智能视频剪辑与包装引擎。 目标:解决酒店从业者(如前台、销售)缺乏专业剪辑技能、视频制作耗时过长的问题。用户只需上传零散的客房/活动素材,系统即可自动识别、卡点、混剪,并添加符合酒店调性的字幕、音乐和转场。

2. 核心场景支持 (Scenarios)

  • 客房展示 (Showcase):突出空间感与设施,节奏平稳,配以优雅音乐。
  • 活动预告 (Event Preview):突出氛围感,快闪节奏,配以动感音乐。
  • 美食探店 (Food):突出细节特写与色彩,温馨治愈节奏。

3. 技术架构与数据流 (Technical Architecture)

3.1 核心链路

  1. 素材上传 (Upload):前端 SmartUploader 将用户的图片/视频直传至企业 OSS 素材库,返回 oss:// 格式的 URL 列表。
  2. 任务组装 (Payload Assembly):将选中的素材列表、视频时长(15s/30s/60s)、风格(StyleId)组装为标准请求体。
  3. 服务派发 (Dispatch):后端调用阿里云 IMS (Intelligent Media Services) 的 SubmitMediaProducingJob 接口,提交智能混剪任务,获取 JobId
  4. 异步轮询 (Polling):前端通过 useAigcPolling 钩子,每隔 3 秒向后端请求 JobId 的状态。
  5. 防盗链渲染 (Anti-leeching):任务完成后,后端返回受保护的 OSS 视频地址,前端调用 getSignatureUrl 换取带有 STS 签名的临时 URL,注入 <video> 标签播放。

3.2 阿里云 IMS 脚本模板策略 (Timeline Strategy)

针对不同场景,预设不同的 Timeline 脚本配置:

  • VideoTrack:自动应用 Transitions(如淡入淡出、黑场过渡),并开启 SmartCrop(智能裁切)以适配 9:16 竖屏。
  • AudioTrack:根据风格挂载特定的 BGM,并应用 AudioFade(音频淡入淡出)防止爆音。
  • SubtitleTrack:若勾选了文案生成,将 AI 生成的解说词合成为 TTS 语音,并自动生成动态字幕。

4. 容错与优雅降级 (Graceful Degradation)

  • 素材质量校验:若上传的素材总时长小于目标生成时长(如传了 5 秒素材要求生成 15 秒视频),前端拦截并提示补充素材。
  • 轮询超时兜底:若超过 3 分钟(maxAttempts: 60)未返回成功,前端中止轮询,提示“云端排队中,视频将在后台继续合成,请稍后在历史记录中查看”。
  • 渲染失败回退:若 IMS 返回素材格式不支持,提供“跳转高级编辑器”或“更换素材”的快捷入口。