使用 GPT-5.4 设计令人愉悦的前端

原文链接：https://developers.openai.com/blog/designing-delightful-frontends-with-gpt-5-4

中文翻译

GPT-5.4 在网页开发方面比其前辈更出色——生成更具视觉吸引力和野心的前端。值得注意的是，我们在训练 GPT-5.4 时专注于改进的 UI 能力和图像使用。通过正确的指导，模型可以生成包含微妙触感、精心设计的交互和美丽图像的生产就绪前端。

网页设计可以产生大量结果。优秀的设计在克制与创新之间取得平衡——汲取经受住时间考验的模式，同时引入新事物。GPT-5.4 已经学习了这种广泛的设计方法，并理解了构建网站的许多不同方式。

当提示不明确时，模型往往会回退到训练数据中的高频模式。其中一些是经过验证的惯例，但许多只是我们想要避免的过度代表的习惯。结果通常是合理且功能正常的，但可能会趋向于通用结构、视觉层次薄弱和与我们脑海中设想不符的设计选择。

本指南解释了引导 GPT-5.4 朝着您设想的设计方向发展的实用技术。

模型改进

虽然 GPT-5.4 在多个方面有所提升，但对于前端工作，我们专注于三个实际收益：

在整个设计过程中增强的图像理解能力
更完整功能的应用程序和网站
更好地使用工具来检查、测试和验证其自身工作

图像理解和工具使用

GPT-5.4 被训练为原生使用图像搜索和图像生成工具，使其能够直接将视觉推理纳入其设计过程。为了获得最佳效果，请指示模型首先生成情绪板或几种视觉选项，然后选择最终资产。

您可以通过明确描述图像应捕捉的属性（例如，风格、色彩构图、布局或情绪）来引导模型使用强视觉参考。您还应包括提示指令，指导模型重用之前生成的图像，调用图像生成工具创建新的视觉内容，或在需要时引用特定的外部图像。

默认使用任何上传/预生成的图像。否则使用图像生成工具创建视觉震撼的图像制品。除非用户明确要求，否则不要引用或链接到网络图像。

功能改进

该模型被训练为开发更完整且功能健全的应用程序。预期模型在长时间任务中将更可靠。您以前认为不可能的游戏和复杂用户体验现在在一两轮内成为可能。

计算机使用和验证

GPT-5.4 是我们第一个接受计算机使用训练的主线模型。它可以原生导航界面，并且结合 Playwright 等工具，可以迭代检查其工作，验证行为并改进实现——从而实现更长、更自主的开发工作流程。

观看我们的发布视频以了解这些能力在行动中的表现。

Playwright 尤其有价值于前端开发。它允许模型检查渲染页面，测试多个视口，导航应用程序流程，并检测与状态或导航相关的问题。提供 Playwright 工具或技能可以显著提高 GPT-5.4 生成抛光、功能完整界面的可能性。通过改进的图像理解，它还为模型提供了一种视觉验证其工作的方式，并检查其是否与提供的参考 UI 匹配。

实用技巧快速入门

如果您只采用本文档中的几种做法，请从以下开始：

选择低推理级别开始。
事先定义您的设计系统和约束（即，排版、配色方案、布局）。
提供视觉参考或情绪板（即附加截图）为模型提供视觉护栏。
事先定义叙事或内容策略以指导模型的内容创建。

这是一个开始的提示。

前端任务

在进行前端设计任务时，避免通用、过度构建的布局。

使用这些硬性规则：

一种构成：第一个视口必须读作一种构成，除非它是仪表盘。
首先品牌：在品牌页面上，品牌或产品名称必须是英雄级别的信号，而不仅仅是导航文本或眉毛。没有任何标题应该盖过品牌。
品牌测试：如果在移除导航后，第一个视口可能属于另一个品牌，那么品牌太弱了。
排版：使用富有表现力、有目的的字体，避免默认字体堆栈（Inter、Roboto、Arial、系统）。
背景：不要依赖平坦、单色背景；使用渐变、图像或微妙模式来构建氛围。
全幅英雄仅限：在着陆页和促销表面上，英雄图像应该是主导的边缘到边缘的视觉平面或背景，默认情况下。不要使用嵌入式英雄图像、侧面板英雄图像、圆角媒体卡、铺贴拼贴或浮动图像块，除非现有设计系统明确要求它。
英雄预算：第一个视口通常应仅包含品牌、一个标题、一个简短的支持句子、一个 CTA 组和一个占主导地位的图像。不要在此处放置统计数据、时间表、活动列表、地址块、促销内容、“本周”提示、元数据行或次要营销内容。
没有英雄覆盖层：不要在英雄媒体之上放置分离的标签、浮动徽章、促销贴纸、信息芯片或行动呼吁框。
卡片：默认：不使用卡片。永远不要在英雄中使用卡片。只有当它们是用户交互的容器时才允许使用卡片。如果移除边框、阴影、背景或半径不会损害交互或理解，则不应是卡片。
每个部分一项工作：每个部分应具有一个目的、一个标题，并且通常具有一个简短的支持句子。
真实视觉锚点：图像应展示产品、场所、氛围或上下文。装饰性渐变和抽象背景不算作主要视觉概念。
减少杂乱：避免药丸簇、统计条、图标行、盒式促销、时间表片段和多个竞争的文本块。
使用运动来创建存在和层次，而不是噪音。为视觉导向的工作至少交付 2-3 种有意图的运动。
颜色与外观：选择清晰的视觉方向；定义 CSS 变量；避免紫色-on-白色默认值。没有紫色偏好或深色模式偏好。
确保页面在台式机和移动设备上都能正常加载。
对于 React 代码，在适当时优先使用现代模式，包括 useEffectEvent、startTransition 和 useDeferredValue，如果团队使用的话。除非已经使用，否则默认不要添加 useMemo/useCallback；遵循仓库的 React 编译器指南。

例外：如果在现有网站或设计系统中工作，请保留既定的模式、结构和视觉语言。

更好设计的技术

从设计原则开始

定义诸如一个 H1 标题，不超过六个部分，最多两种字体，一种强调颜色，以及折叠以上的主要 CTA 之类的约束。

提供视觉参考

参考截图或情绪板有助于模型推断布局节奏、排版比例、间距系统和图像处理。以下是 GPT-5.4 在 Codex 中受纽约咖啡文化和 Y2K 美学启发而生成的其自身情绪板的示例。

将页面构建为叙事

典型的营销页面结构：

英雄——建立身份和承诺
支持性图像——展示背景或环境
产品详情——解释产品
社会证明——建立可信度
最终 CTA——将兴趣转化为行动

指导设计系统遵守

鼓励模型尽早建立清晰的设计系统。定义核心设计标记，如背景、表面、主要文本、次要文本和强调色，以及排版角色如显示、标题、正文和标注。这种结构有助于模型在应用程序中生成一致且可扩展的 UI 模式。

对于大多数网络项目，从熟悉的堆栈如 React 和 Tailwind 开始效果很好。GPT-5.4 在使用这些工具时表现尤为出色，使其能够快速迭代并达到抛光结果。

动态和分层的 UI 元素可能会引入复杂性，特别是当固定或浮动组件与主要内容交互时。在使用动画、覆盖层或装饰层时，有助于包括指导，鼓励安全的布局行为。例如：

保持固定或浮动 UI 元素不与文本、按钮或其他关键内容在各种屏幕尺寸上重叠。将它们放置在安全区域，在主要内容后面（如果适用），并保持足够的间距。

降低推理级别

对于更简单的网站，更多的推理并不总是更好。实际上，低和中等推理水平往往会导致更强的前端结果，帮助模型保持快速、专注且不易过度思考，同时仍然为更雄心勃勃的设计留出提升推理的余地。

用真实内容为设计奠基

向模型提供真实文案、产品背景或明确的项目目标是改善前端结果的最简单方法之一。这种背景有助于它选择正确的网站结构，塑造更清晰的部分级别叙事，并编写更可信的信息，而不是陷入一般的占位符模式。

结合前端技能

为了帮助人们在一般前端任务中充分利用 GPT-5.4，我们还准备了一个专门的 frontend-skill 您可以在下面找到。它通过强调受限构图、图像主导的层次结构、协调的内容结构和品味十足的运动，同时避免通用卡片、弱品牌和 UI 杂乱，来帮助模型从一开始就生成更抛光、有意和愉悦的设计。

前端技能

名称：frontend-skill 描述：在任务要求具有视觉吸引力的着陆页、网站、应用程序、原型、演示或游戏 UI 时使用。此技能强调受限构图、图像主导的层次结构、协调的内容结构和品味十足的运动，同时避免通用卡片、弱品牌和 UI 杂乱。

前端技能

当工作质量取决于艺术指导、层次、克制、图像和运动而不是组件数量时，请使用此技能。

目标：交付感觉刻意、高级和当前的界面。默认情况下，倾向于奖项级别构图：一个大想法、强烈的图像、稀少的副本、严格的间距和少量难忘的运动。

工作模型

在构建之前，请写三件事：

视觉论点：一句描述情绪、材料和能量的句子
内容计划：英雄、支持、细节、最终 CTA
交互论点：改变页面感觉的 2-3 种运动想法

每个部分获得一项工作，一个主要的视觉想法，以及一个主要的收获或行动。

美丽的默认值

从构图开始，而不是从组件开始。
首选全幅英雄或全画布视觉锚点。
让品牌或产品名称成为最响亮的文本。
保持副本简短到可以在几秒内扫描。
在添加 chrome 之前使用空白、对齐、比例、裁剪和对比。
限制系统：最多两种字体，默认一种强调颜色。
默认为无卡片布局。使用部分、列、分隔符、列表和媒体块而不是卡片。
将第一个视口视为海报，而不是文档。

着陆页

默认序列：

英雄：品牌或产品、承诺、CTA 和一个占主导地位的视觉
支持：一个具体的功能、优惠或证明点
详细信息：氛围、工作流程、产品深度或故事
最终 CTA：转化、开始、访问或联系

英雄规则：

仅一种构成。
全幅图像或占主导地位的视觉平面。
规范的全幅规则：在品牌着陆页上，英雄本身必须边缘到边缘运行，没有继承的页面间距，框架容器或共享最大宽度；仅限内部文本/操作列。
品牌第一，标题第二，正文第三，CTA 第四。
不使用英雄卡片、统计条、标志云、药丸汤或默认的浮动仪表盘。
保持标题大约为桌面端的 2-3 行，并且在移动端上可以一眼读完。
保持文本列窄并固定在图像的平静区域。
所有覆盖在图像上的文本必须保持强烈对比度和清晰的点击目标。

如果在移除图像后，第一个视口仍然有效，则图像太弱。如果在隐藏导航后品牌消失，则层级太弱。

视口预算：

如果第一屏幕包括粘性/固定头部，则该头部计入英雄。组合头部+英雄内容必须在常见台式机和移动尺寸内的初始视口内适合。
当使用 100vh/100svh 英雄时，减去持久 UI chrome（calc(100svh - header-height)）或者将头部覆盖在正常流程之上。

应用

默认为 Linear 风格的克制：

平静的表面层次结构
强排版和间距
少量颜色
密集但可读的信息
最小的 chrome
只有当卡片是交互时才使用卡片

对于应用程序 UI，请围绕以下内容进行组织：

主要工作区
导航
次要背景或检查器
一个明确的强调色用于动作或状态

避免：

仪表盘卡片马赛克
每个区域都有厚边框
常规产品 UI 背后的装饰性渐变
多种竞争性强调颜色
不能改善扫描的装饰性图标

如果一个面板可以变成纯布局而不会失去意义，请移除卡片处理。

图像

图像必须完成叙事工作。

为品牌、场所、编辑页面和生活方式产品使用至少一个强烈、看似真实的图像。
优先使用情境摄影而非抽象渐变或假 3D 对象。
选择或裁剪图像，使其具有用于文本的稳定 tonal 区域。
不要使用带有嵌入式标识、标志或与 UI 争夺的排版杂乱的图像。
不要生成带有内置 UI 框架的图像

[内容因长度被截断，完整英文原文请参考来源链接]

此文档为机器翻译与原文对照版本，建议阅读英文原文以获取最准确信息