Skip to content

酒店智能体 B端 AIGC 产品演进战略共识

日期:2026-03-23 背景:在开发 hotel-web 核心功能期间,关于产品形态(Agent 对话模式 vs 万相营造表单工具模式)的深度讨论与战略重组记录。

1. 业务痛点与用户洞察 (来自业务负责人的思考)

在现阶段的设计中,我们比较侧重于“Agent 模式”来生成文案、图片、视频。但是,如果要将 Agent 模式在 B 端做好,必须提供一套行之有效的工作方法、技能和工作流

目前针对酒店业务,用户面对纯对话框时,往往需要不断试错才能生成符合要求的结果。为此,我们对标了业界两款产品:

  1. 火山引擎创作 Agent (console.volcengine.com/kickart/welcome):倾向于智能体的 B 端服务工具,核心交互是一个巨大的开放式输入框。
  2. 阿里万相营造 (www.wanxiang.art/):典型的具备丰富操作参数、模板和明确指引的 B 端工具。

核心疑问:针对 hotel-web 这种对 B 端提供生成服务的工具,我们究竟应该选用哪种模式?


2. 战略评估结论 (产品经理与技术架构视角)

这是一个极其敏锐且切中要害的产品战略问题。结论是:针对 B 端垂直行业(特别是酒店业),纯粹的“对话式/输入框式 Agent 模式”通常会遭遇严重的水土不服;我们现阶段必须坚定地转向“结构化参数 + 工作流导向的工具模式”(类似万相营造)。

👨‍💼 产品经理视角:为什么 B 端需要“万相营造”模式?

1. 消除“白板恐惧症”(Blank Canvas Syndrome)

  • Agent 模式的痛点:酒店的运营人员、前台经理并不是 Prompt 工程师。面对一个空荡荡的输入框,他们往往只会输入“帮我生成一个海景房的海报”,结果生成的内容平庸且不可控。
  • 工具模式的优势:万相营造通过“商品图上传 + 尺寸选择 + 场景模板”的结构化表单,将极其复杂的 Prompt 编写过程黑盒化了。用户只需要做“选择题”而不是“填空题”,极大地降低了使用门槛。

2. B 端用户的核心诉求是“确定性”与“SOP(标准作业程序)”

  • C 端用户为了好玩,愿意不断抽卡和尝试(容忍失败)。
  • B 端用户是为了完成工作(例如:老板要求下午发一篇端午节促销小红书)。他们需要极高的确定性。万相营造的模式本质上是提供了一套 SOP:上传 -> 选风格 -> 选尺寸 -> 生成。这种工作流是可复用的、结果是预期内的。

3. 垂直领域的行业 Know-How 封装

  • 酒店行业有特定的术语和卖点(如:行政酒廊、无边泳池、全景落地窗、亲子套房)。在工具模式下,我们可以把这些做成“标签(Tags)”或“快捷卡片”,直接融入UI中。纯 Agent 模式很难直观地展现我们产品对酒店行业的专业度。

👨‍💻 资深开发工程师视角:为什么“结构化工具”在底层更稳健?

1. 提示词工程(Prompt Engineering)的工程化管理

  • 如果让用户直接写 Prompt,后端几乎无法做质量控制。
  • 采用表单工具模式,前端收集离散参数,后端可以构建一个 Prompt Compiler(提示词编译器)
    • 用户输入:主体=[海景大床房图], 风格=[极简原木], 光影=[清晨阳光]。
    • 底层编译"A high quality professional photography of a modern hotel room with ocean view, minimalist wooden furniture, morning sunlight streaming through floor-to-ceiling windows, 8k resolution..."
    • 这样,模型生成的下限被系统兜底,质量会成倍提升。

2. API 参数与大模型限制的完美契合

  • 以火山 Seedream 模型为例,API 有严格的像素限制(不能超过 10,404,496),且 Seedance 视频生成有严格的时长限制(2s-12s)。
  • 在纯 Agent 模式下,大模型很容易组装出非法的分辨率参数导致请求崩溃。
  • 在工具模式下,前端直接写死 1080x1920 等安全参数,并在用户上传参考图时直接进行裁剪和校验,极大地提升了系统的健壮性(Robustness)

3. 多模态协同的复杂状态管理

  • 类似“保留商品主体,替换背景”(图生图、ControlNet)等技术,在纯对话框里很难交互。需要明确的图层概念(原图、蒙版、参考图),这必须依赖丰富的 GUI 组件(如上传拖拽组件)。

3. 最终落地方案:GUI 外壳 + Agent 内核 (Copilot 模式)

基于以上严苛的评估,hotel-web 采用 “GUI 外壳 + Agent 内核” 的融合模式,偏向万相营造的交互,但在局部保留 Agent 的灵活性:

  1. 重构交互范式(降级对话,升级表单): 将巨大的 Prompt 输入框拆解为几个核心维度:

    • 上传区:酒店实景图(作为图生图的底图,保持真实感)。
    • 风格库:预设酒店常用风格(高级商务、温馨亲子、度假风等),背后映射调优好的系统 Prompt。
    • 核心卖点(快捷标签):如“落地窗”、“海景”,供用户点击。
  2. 隐藏复杂性: 向用户隐藏底层模型名称和具体分辨率数字。用“小红书配图”、“朋友圈海报”来代替 768x1024

  3. Agent 模式的战略收敛(全局智能大堂经理)

    • 移除首页巨型输入框:避免视觉焦点分散和功能冗余。
    • 悬浮 Copilot:将 Agent 收敛为右下角的智能形象悬浮窗。用户点击打开对话,输入自然语言后,Agent 作为“智能路由器”,将用户引导至具体的工具页面(如海报生成),并实现参数的预填。

总结: 不要试图教酒店老板如何成为 Prompt 工程师。我们将大模型能力包装成一个**“带有智能参数和行业 SOP 的专业创作软件”**。