国思软件 - 刚刚，OpenAI最强图像生成API上线，一张图1毛5！

　　编辑：桃子好困

　　GPT-4o 之后，OpenAI 原生多模态图像生成模型 API 正式推出了，一张图低至 0.02 美元。新模型能够结合世界知识，生成更加符合上下文图像，质量更高，还支持多种功能自定义。

昨夜，OpenAI 发布全新图像生成模型 gpt-image-1，API 向所有开发者开放。

　　这一次，他们直接把每张图的成本打到几美分。

　　对于低、中、高质量的方形图像，生成大约花费 0.02 美元、0.07 美元、0.19 美元。

　　gpt-image-1 集成了三大核心功能：图像生成、图像编辑、图像变体（仅限 DALL·E 2）。

　　与 GPT-4o 图像生成不同，gpt-image-1 最大的特点，在于支持各种高级功能的定制。

　　比如，自定义输出图像的质量、尺寸、格式、压缩程度，甚至可选择是否需要透明背景，能够满足多样化创意需求。

　　它具备了强大的通用能力，不仅能够创作多种风格图片，还能精准遵循自定义需求。通过结合世界知识，生成更符合上下文的图像。

　　现在，你就可以在 playground 中使用 gpt-image-1 来快速迭代提示词和图像：

　　GPT-4o 上线掀起全网吉卜力风潮，并在发布首周全球 1.3 亿用户，创作了超 7 亿图片。

　　gpt-image-1 作为 OpenAI 全新一个原生多模态图像模型，随着 API 开放，将会在未来极大地释放人们创意。

　　效果一览

　　在官方 API 文档「探索」区，OpenAI 放出了许多 gpt-image-1 生成图片的 demo，效果非常惊艳。

　　接下来，就一睹为快吧。

　　一句话，让 gpt-image-1 展示出创建鳄梨酱所需的所有食材。

　　下面这张梦幻之境，可是用了一个「小作文」提示词才完成的。

　　再来看它创作的外星人 Glorptak，有着凝胶状身体，半透明发光，非常可爱。

　　对于模特、电商行业来说，gpt-image-1 将重塑创作方式。上传一张衣服图、一张人的照片，就能看到衣服上身的效果了。

　　橄榄油宣传图，也只需找一张背景图，gpt-image-1 瞬间完成P图。

　　更神奇的是，上传一张房屋设计平面图，gpt-image-1 就能将其变为 3D 效果，更加直观。

　　番茄酱广告，非常有视觉冲击力。

　　设计矿泉水的瓶身，也是多种风格拿捏。

　　生成超写实的 3D 图标，看着非常有质感。

　　gpt-image-1 还能生成粗线条手绘风格图解，为回针缝制法每一步配上了简洁的说明文字。

　　上传一张 CD 模板图，让 gpt-image-1 生成金属乐队黑胶唱片。

　　还有各种纹理的防止图案，也是非常有创意。

　　还有动画分镜脚本——马匹跳跃循环序列，gpt-image-1 可做到逐帧解剖要点。

　　上传独立流行音乐人的照片，一张演唱会门票直接设计好了。

　　自定义图像输出，精准创意

　　目前，OpenAI GPT Image API 提供了丰富的自定义选项，让开发者完全掌控输出效果。

尺寸：支持多种分辨率，比如 1024x1024, 1024x1536
质量：可选 low，medium，high 三种渲染质量
格式：文件输出格式
压缩：针对 JPEG 和 WebP 格式，可设置0-100% 级别的压缩
背景：透明或不透明

　　生成图像

　　通过图像生成端点，仅凭一段文本提示，即可生成令人惊叹的图像。

　　可设置参数 n ，一次可生成多张图像（默认情况下，API 返回单张图片）。

from openai import OpenAI
import base64
client = OpenAI ()
result = client.images.generate (
    model="gpt-image-1",
    prompt="Draw a rocket in front of a blackhole in deep space"
)
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode (image_base64)
# Save the image to a file
with open ("blackhole.png", "wb") as f:
    f.write (image_bytes)

　　图像编辑

　　而图像编辑功能，可以让创意更进一步。通过图像编辑端点，你可以：

直接编辑现有图片
参考图像生成新图片：上传多张参考图像，然后生成新图
局部编辑（inpainting）：通过上传图像和蒙版，精准替换指定的区域

　　参考图像生成新图片

　　比如，上传四张礼品图片，生成一个包含所有礼品的精美礼物篮的图像。

from openai import OpenAI
client = OpenAI ()
result = client.images.edit (
    model="gpt-image-1",
    image=[
      open ("body-lotion.png", "rb"),
      open ("bath-bomb.png", "rb"),
      open ("incense-kit.png", "rb"),
      open ("soap.png", "rb"),
    ],
    prompt="Generate a photorealistic image of a gift basket on a white background labeled 'Relax & Unwind' with a ribbon and handwriting-like font, containing all the items in the reference pictures"
)
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode (image_base64)
# Save the image to a file
with open ("gift-basket.png", "wb") as f:
    f.write (image_bytes)

　　使用蒙版编辑图像（局部编辑）

　　你可以上传一个蒙版来编辑图像，蒙版中的透明区域将被替换，而黑色区域保持不变。

　　OpenAI 建议，你可以使用提示来描述整个新图像，而不仅仅是被擦除的区域。

　　蒙版要求：

　　1. 图像和蒙版需要格式一致，尺寸相同，大小不超过 25MB。

　　2. 蒙版需包含 Alpha 通道，在图像编辑工具中保存蒙版时，务必勾选「保存 Alpha 通道」。

from openai import OpenAI
client = OpenAI ()
result = client.images.edit (
    model="gpt-image-1",
    image=open ("sunlit_lounge.png", "rb"),
    mask=open ("mask.png", "rb"),
    prompt="A sunlit indoor lounge area with a pool containing a flamingo"
)
image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode (image_base64)
# Save the image to a file
with open ("composition.png", "wb") as f:
    f.write (image_bytes)

　　在自定义中，还需要注意的包括：

　　方形图片以标准质量生成的速度最快，默认大小是 1024x1024。

　　Image API 返回 base64 编码的图像数据，默认格式是 png ，但你也可以请求 jpeg 或 webp。

　　如果使用 jpeg 或 webp，还可以指定 output_compression 参数来控制压缩级别（0-100%）。例如， output_compression=50 就是把图像压缩 50%。

　　此外，gpt-image-1 支持透明背景。要启用透明度，需将 background 参数设置为 transparent。

from openai import OpenAI
import base64
client = OpenAI ()
result = client.images.generate (
    model="gpt-image-1",
    prompt="Draw a 2D pixel art style sprite sheet of a tabby gray cat",
    size="1024x1024",
    background="transparent",
    quality="high",
)
image_base64 = result.json ()["data"][0]["b64_json"]
image_bytes = base64.b64decode (image_base64)
# Save the image to a file
with open ("sprite.png", "wb") as f:
    f.write (image_bytes)