Skip to content

AI 视频矩阵 (AI Video Matrix) 单项设计规范

为了满足酒店行业在短视频平台的营销需求,AI 视频模块下的 7 个单项工具需进行差异化设计。其核心底层能力分为两类:

  1. 智能混剪 (Smart Mix):基于阿里云 IMS,将用户上传的素材(图片/视频片段)结合智能脚本、转场、配乐进行二次剪辑包装。
  2. 视频生成 (Video Generation):基于火山引擎(豆包·Seedance),将静态图片通过大模型转换为动态视频。

1. 单项需求与参数设计矩阵

1.1 宣传短片 (Promo Short)

  • 业务痛点:酒店官方账号需要发布高质量的品牌/客房/设施宣传片,要求大气、专业。
  • 底层引擎:阿里云 IMS(智能混剪)
  • 前端参数设计
    • 【必填】素材上传(支持多选,建议 5-15 个)
    • 【必填】宣传类型(客房展示/设施介绍/婚宴场地/品牌形象)
    • 【可选】视频节奏(优雅舒缓/动感快闪/温馨治愈)
    • 【可选】视频时长(15s / 30s / 60s)
  • 底层策略 (IMS Script)
    • Timeline 策略:如果选择“优雅舒缓”,使用叠化(Crossfade)转场;如果选择“动感快闪”,使用硬切和特效转场,并开启“音频卡点 (Beat Sync)”功能。

1.2 活动预告 (Event Preview)

  • 业务痛点:节假日派对、年会、音乐节等活动前的预热,需要极强的悬念和氛围感。
  • 底层引擎:阿里云 IMS(智能混剪)
  • 前端参数设计
    • 【必填】素材上传(活动往期回顾/场地空镜)
    • 【必填】活动主题文案(用于生成片头大字字幕)
    • 【可选】倒计时特效(开启/关闭)
  • 底层策略 (IMS Script)
    • Timeline 策略:强制前 3 秒快剪,配以重低音音效(SFX)。在视频末尾强制插入“时间+地点”的定帧文本轨道。

1.3 达人探店 (Influencer Vlog)

  • 业务痛点:缺乏真实的网红出镜,希望以第一人称视角(Vlog)介绍酒店,带入感强。
  • 底层引擎:阿里云 IMS(智能混剪) + 虚拟数字人/TTS配音
  • 前端参数设计
    • 【必填】素材上传(探店路线顺序素材)
    • 【必填】探店脚本/文案(可接入 AI 文案引擎一键生成)
    • 【可选】配音音色(元气少女/成熟御姐/幽默小哥)
  • 底层策略 (IMS Script)
    • Timeline 策略:将文案转换为 TTS 语音轨道,并开启“音频闪避 (Audio Ducking)”——即解说时背景音乐自动压低。强制开启智能字幕轨道。

1.4 游客打卡 (Visitor Checkin)

  • 业务痛点:鼓励 UGC 传播,风格偏向于小红书/抖音的碎片化记录、拼图和滤镜。
  • 底层引擎:阿里云 IMS(智能混剪)
  • 前端参数设计
    • 【必填】素材上传(支持大量静态图片)
    • 【可选】网红滤镜(胶片风/拍立得/日系清新/赛博朋克)
    • 【可选】网感贴纸(开启/关闭)
  • 底层策略 (IMS Script)
    • Timeline 策略:大量应用画中画(PIP)、分屏和拍立得边框特效。强制将静态图片转换为 Ken Burns(缓慢推拉摇移)效果,增加动态感。

1.5 员工介绍 (Staff Intro)

  • 业务痛点:展示酒店金钥匙管家、大厨、调酒师的专业形象,提升服务温度。
  • 底层引擎:阿里云 IMS(智能混剪)
  • 前端参数设计
    • 【必填】员工照片/工作视频上传
    • 【必填】员工姓名与头衔
    • 【可选】展示风格(纪录片访谈/高燃技能展示)
  • 底层策略 (IMS Script)
    • Timeline 策略:底部强制添加专业的“姓名+Title”下三分之一字幕条(Lower Third)。若为“技能展示”(如大厨颠勺),则局部开启视频变速(慢动作特写)。

1.6 动态微视 (Dynamic Micro-video)

  • 业务痛点:只有一张静态的酒店外观图或客房图,想让它“动起来”(如水面波纹、云朵飘动),用于朋友圈吸引眼球。
  • 底层引擎:火山引擎(豆包·Seedance - 图生视频)
  • 前端参数设计
    • 【必填】单张图片上传
    • 【可选】运镜方式(推镜头/拉镜头/平移/环绕)
    • 【可选】动态提示词(如:微风吹拂,水面波光粼粼,树叶摇晃)
  • 底层策略
    • 此场景完全脱离 IMS,调用 volcengine/video/generation 接口。需要处理长达数分钟的异步生成轮询。

1.7 智能成片 (Smart Mix - 基础引擎)

  • 业务痛点:用户不想选任何复杂场景,只想“一键把这堆素材变成视频”。
  • 底层引擎:阿里云 IMS(智能混剪 - 全自动模式)
  • 前端参数设计
    • 【必填】素材库批量选择
    • 【核心按钮】一键魔法成片(Magic Mix)
  • 底层策略
    • 不要求用户输入任何脚本。后端直接调用 IMS 的 SubmitSmartCutJob(智能一键成片 API),由阿里云 AI 自动分析素材的主体和精彩片段进行裁切和配乐。

2. 核心架构约束

  1. 防盗链红线:只要经过 IMS 处理,产出的视频都在内部 OSS,前端在渲染 <video> 时必须走 STS 签名,不可直接绑定原始 URL。
  2. 状态管理分离:动态微视(Seedance)的生成时间远大于智能混剪(IMS)。两者的轮询策略应分别配置不同的超时时间(IMS 建议 1 分钟,Seedance 建议 5 分钟)。