AI 视频矩阵 (AI Video Matrix) 单项设计规范
为了满足酒店行业在短视频平台的营销需求,AI 视频模块下的 7 个单项工具需进行差异化设计。其核心底层能力分为两类:
- 智能混剪 (Smart Mix):基于阿里云 IMS,将用户上传的素材(图片/视频片段)结合智能脚本、转场、配乐进行二次剪辑包装。
- 视频生成 (Video Generation):基于火山引擎(豆包·Seedance),将静态图片通过大模型转换为动态视频。
1. 单项需求与参数设计矩阵
1.1 宣传短片 (Promo Short)
- 业务痛点:酒店官方账号需要发布高质量的品牌/客房/设施宣传片,要求大气、专业。
- 底层引擎:阿里云 IMS(智能混剪)
- 前端参数设计:
- 【必填】素材上传(支持多选,建议 5-15 个)
- 【必填】宣传类型(客房展示/设施介绍/婚宴场地/品牌形象)
- 【可选】视频节奏(优雅舒缓/动感快闪/温馨治愈)
- 【可选】视频时长(15s / 30s / 60s)
- 底层策略 (IMS Script):
- Timeline 策略:如果选择“优雅舒缓”,使用叠化(Crossfade)转场;如果选择“动感快闪”,使用硬切和特效转场,并开启“音频卡点 (Beat Sync)”功能。
1.2 活动预告 (Event Preview)
- 业务痛点:节假日派对、年会、音乐节等活动前的预热,需要极强的悬念和氛围感。
- 底层引擎:阿里云 IMS(智能混剪)
- 前端参数设计:
- 【必填】素材上传(活动往期回顾/场地空镜)
- 【必填】活动主题文案(用于生成片头大字字幕)
- 【可选】倒计时特效(开启/关闭)
- 底层策略 (IMS Script):
- Timeline 策略:强制前 3 秒快剪,配以重低音音效(SFX)。在视频末尾强制插入“时间+地点”的定帧文本轨道。
1.3 达人探店 (Influencer Vlog)
- 业务痛点:缺乏真实的网红出镜,希望以第一人称视角(Vlog)介绍酒店,带入感强。
- 底层引擎:阿里云 IMS(智能混剪) + 虚拟数字人/TTS配音
- 前端参数设计:
- 【必填】素材上传(探店路线顺序素材)
- 【必填】探店脚本/文案(可接入 AI 文案引擎一键生成)
- 【可选】配音音色(元气少女/成熟御姐/幽默小哥)
- 底层策略 (IMS Script):
- Timeline 策略:将文案转换为 TTS 语音轨道,并开启“音频闪避 (Audio Ducking)”——即解说时背景音乐自动压低。强制开启智能字幕轨道。
1.4 游客打卡 (Visitor Checkin)
- 业务痛点:鼓励 UGC 传播,风格偏向于小红书/抖音的碎片化记录、拼图和滤镜。
- 底层引擎:阿里云 IMS(智能混剪)
- 前端参数设计:
- 【必填】素材上传(支持大量静态图片)
- 【可选】网红滤镜(胶片风/拍立得/日系清新/赛博朋克)
- 【可选】网感贴纸(开启/关闭)
- 底层策略 (IMS Script):
- Timeline 策略:大量应用画中画(PIP)、分屏和拍立得边框特效。强制将静态图片转换为 Ken Burns(缓慢推拉摇移)效果,增加动态感。
1.5 员工介绍 (Staff Intro)
- 业务痛点:展示酒店金钥匙管家、大厨、调酒师的专业形象,提升服务温度。
- 底层引擎:阿里云 IMS(智能混剪)
- 前端参数设计:
- 【必填】员工照片/工作视频上传
- 【必填】员工姓名与头衔
- 【可选】展示风格(纪录片访谈/高燃技能展示)
- 底层策略 (IMS Script):
- Timeline 策略:底部强制添加专业的“姓名+Title”下三分之一字幕条(Lower Third)。若为“技能展示”(如大厨颠勺),则局部开启视频变速(慢动作特写)。
1.6 动态微视 (Dynamic Micro-video)
- 业务痛点:只有一张静态的酒店外观图或客房图,想让它“动起来”(如水面波纹、云朵飘动),用于朋友圈吸引眼球。
- 底层引擎:火山引擎(豆包·Seedance - 图生视频)
- 前端参数设计:
- 【必填】单张图片上传
- 【可选】运镜方式(推镜头/拉镜头/平移/环绕)
- 【可选】动态提示词(如:微风吹拂,水面波光粼粼,树叶摇晃)
- 底层策略:
- 此场景完全脱离 IMS,调用
volcengine/video/generation接口。需要处理长达数分钟的异步生成轮询。
- 此场景完全脱离 IMS,调用
1.7 智能成片 (Smart Mix - 基础引擎)
- 业务痛点:用户不想选任何复杂场景,只想“一键把这堆素材变成视频”。
- 底层引擎:阿里云 IMS(智能混剪 - 全自动模式)
- 前端参数设计:
- 【必填】素材库批量选择
- 【核心按钮】一键魔法成片(Magic Mix)
- 底层策略:
- 不要求用户输入任何脚本。后端直接调用 IMS 的
SubmitSmartCutJob(智能一键成片 API),由阿里云 AI 自动分析素材的主体和精彩片段进行裁切和配乐。
- 不要求用户输入任何脚本。后端直接调用 IMS 的
2. 核心架构约束
- 防盗链红线:只要经过 IMS 处理,产出的视频都在内部 OSS,前端在渲染
<video>时必须走 STS 签名,不可直接绑定原始 URL。 - 状态管理分离:动态微视(Seedance)的生成时间远大于智能混剪(IMS)。两者的轮询策略应分别配置不同的超时时间(IMS 建议 1 分钟,Seedance 建议 5 分钟)。