酒店智能体 B端 AIGC 产品演进战略共识
日期:2026-03-23 背景:在开发
hotel-web核心功能期间,关于产品形态(Agent 对话模式 vs 万相营造表单工具模式)的深度讨论与战略重组记录。
1. 业务痛点与用户洞察 (来自业务负责人的思考)
在现阶段的设计中,我们比较侧重于“Agent 模式”来生成文案、图片、视频。但是,如果要将 Agent 模式在 B 端做好,必须提供一套行之有效的工作方法、技能和工作流。
目前针对酒店业务,用户面对纯对话框时,往往需要不断试错才能生成符合要求的结果。为此,我们对标了业界两款产品:
- 火山引擎创作 Agent (
console.volcengine.com/kickart/welcome):倾向于智能体的 B 端服务工具,核心交互是一个巨大的开放式输入框。 - 阿里万相营造 (
www.wanxiang.art/):典型的具备丰富操作参数、模板和明确指引的 B 端工具。
核心疑问:针对 hotel-web 这种对 B 端提供生成服务的工具,我们究竟应该选用哪种模式?
2. 战略评估结论 (产品经理与技术架构视角)
这是一个极其敏锐且切中要害的产品战略问题。结论是:针对 B 端垂直行业(特别是酒店业),纯粹的“对话式/输入框式 Agent 模式”通常会遭遇严重的水土不服;我们现阶段必须坚定地转向“结构化参数 + 工作流导向的工具模式”(类似万相营造)。
👨💼 产品经理视角:为什么 B 端需要“万相营造”模式?
1. 消除“白板恐惧症”(Blank Canvas Syndrome)
- Agent 模式的痛点:酒店的运营人员、前台经理并不是 Prompt 工程师。面对一个空荡荡的输入框,他们往往只会输入“帮我生成一个海景房的海报”,结果生成的内容平庸且不可控。
- 工具模式的优势:万相营造通过“商品图上传 + 尺寸选择 + 场景模板”的结构化表单,将极其复杂的 Prompt 编写过程黑盒化了。用户只需要做“选择题”而不是“填空题”,极大地降低了使用门槛。
2. B 端用户的核心诉求是“确定性”与“SOP(标准作业程序)”
- C 端用户为了好玩,愿意不断抽卡和尝试(容忍失败)。
- B 端用户是为了完成工作(例如:老板要求下午发一篇端午节促销小红书)。他们需要极高的确定性。万相营造的模式本质上是提供了一套 SOP:上传 -> 选风格 -> 选尺寸 -> 生成。这种工作流是可复用的、结果是预期内的。
3. 垂直领域的行业 Know-How 封装
- 酒店行业有特定的术语和卖点(如:行政酒廊、无边泳池、全景落地窗、亲子套房)。在工具模式下,我们可以把这些做成“标签(Tags)”或“快捷卡片”,直接融入UI中。纯 Agent 模式很难直观地展现我们产品对酒店行业的专业度。
👨💻 资深开发工程师视角:为什么“结构化工具”在底层更稳健?
1. 提示词工程(Prompt Engineering)的工程化管理
- 如果让用户直接写 Prompt,后端几乎无法做质量控制。
- 采用表单工具模式,前端收集离散参数,后端可以构建一个 Prompt Compiler(提示词编译器)。
- 用户输入:主体=[海景大床房图], 风格=[极简原木], 光影=[清晨阳光]。
- 底层编译:
"A high quality professional photography of a modern hotel room with ocean view, minimalist wooden furniture, morning sunlight streaming through floor-to-ceiling windows, 8k resolution..." - 这样,模型生成的下限被系统兜底,质量会成倍提升。
2. API 参数与大模型限制的完美契合
- 以火山 Seedream 模型为例,API 有严格的像素限制(不能超过 10,404,496),且 Seedance 视频生成有严格的时长限制(2s-12s)。
- 在纯 Agent 模式下,大模型很容易组装出非法的分辨率参数导致请求崩溃。
- 在工具模式下,前端直接写死
1080x1920等安全参数,并在用户上传参考图时直接进行裁剪和校验,极大地提升了系统的健壮性(Robustness)。
3. 多模态协同的复杂状态管理
- 类似“保留商品主体,替换背景”(图生图、ControlNet)等技术,在纯对话框里很难交互。需要明确的图层概念(原图、蒙版、参考图),这必须依赖丰富的 GUI 组件(如上传拖拽组件)。
3. 最终落地方案:GUI 外壳 + Agent 内核 (Copilot 模式)
基于以上严苛的评估,hotel-web 采用 “GUI 外壳 + Agent 内核” 的融合模式,偏向万相营造的交互,但在局部保留 Agent 的灵活性:
重构交互范式(降级对话,升级表单): 将巨大的
Prompt输入框拆解为几个核心维度:- 上传区:酒店实景图(作为图生图的底图,保持真实感)。
- 风格库:预设酒店常用风格(高级商务、温馨亲子、度假风等),背后映射调优好的系统 Prompt。
- 核心卖点(快捷标签):如“落地窗”、“海景”,供用户点击。
隐藏复杂性: 向用户隐藏底层模型名称和具体分辨率数字。用“小红书配图”、“朋友圈海报”来代替
768x1024。Agent 模式的战略收敛(全局智能大堂经理):
- 移除首页巨型输入框:避免视觉焦点分散和功能冗余。
- 悬浮 Copilot:将 Agent 收敛为右下角的智能形象悬浮窗。用户点击打开对话,输入自然语言后,Agent 作为“智能路由器”,将用户引导至具体的工具页面(如海报生成),并实现参数的预填。
总结: 不要试图教酒店老板如何成为 Prompt 工程师。我们将大模型能力包装成一个**“带有智能参数和行业 SOP 的专业创作软件”**。