14个最热门的文生图API平台
AI 在相对较短的时间内成为一种无处不在的工具,各种 API 都提供视频、图像、文本甚至音频生成功能。
本文将介绍 14 个利用 AI 和 LLM 的最佳文本转图像 API。这些工具是尖端的,提供最新的文本转图像和各种其他输入和输出格式,并有望在极短的时间内加速你的产品!
1、DALL·E 3
DALL·E 3 和 OpenAI 图像生成被许多人认为是过去十年 AI 图像生成器新运动的开端。结果既接近人性化又高度可定制。DALL·E 在围绕 AI 的对话中几乎无处不在,“ChatGPT”通常被用作一个包罗万象的术语,既涵盖实际的 ChatGPT 框架,也涵盖 DALL·E 特定的实现。
最近将 DALL·E 内置到 ChatGPT 作为核心功能,这种情况仍在继续。在 OpenAI API 家族中,将功能合并到大型 API 中的做法仍在继续。
示例 API 请求:
curl https://api.openai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "dall-e-3",
"prompt": "a white siamese cat",
"n": 1,
"size": "1024x1024"
}'
2、Getty Images
关于 AI 生成的图像和提供文本到图像生成的模型,最大的悬而未决的问题之一是版权问题。虽然这些模型可以生成非常好的图像,但它们通常是在受版权保护的材料上进行训练的,这引发了关于在商业应用中使用此类图像的道德和合法性的讨论
这个问题尚未完全解决,但 Getty 通过提供强大的 API 取得了进展,该 API 可提供商业安全的图像。现在生成这些图像的能力无需担心未来的立法或当前的道德问题,使该产品特别适合商业应用。
示例 API 请求:
curl -X 'POST' \ 'https://api.gettyimages.com/v3/ai/image-generations' \
-H 'accept: application/json' \
-H 'Content-Type: application/json' \
-d '{"prompt": "an image of a person coding an API", "negative_prompt": "string", "aspect_ratio": "string", "media_type": "photography", "mood": "black_and_white", "product_id": 0, "project_code": "string", "notes": "string"}'
3、Google Imagen 2
Imagen 2 是一款引人注目的解决方案,由全球最大的数据参与者之一 Google 提供支持。这本身就是一个强大的卖点 — Google 以其他 AI 或 LLM 提供商无法复制的方式进行数据交易。这些数据使 Imagen 2 能够创建极其逼真和高质量的图像,并通过 Google Cloud Vertex AI 中的 Imagen API 将其交付给开发人员。
尽管谷歌是一家瞬息万变的公司,以关闭其产品线而闻名,但它已发出信号,表示人工智能是该公司的重点,这可能会缓解其中的一些担忧。
4、Stability AI 开发者平台
Stability AI 以其稳定的扩散模型而闻名,该模型为 AI 图像生成设定了主要评判标准,Stability AI 已经做了很多工作,将其 AI 产品打包成一个引人注目且实用的商业套件。
这项努力的最终成果是 Stability AI 开发者平台。虽然该平台使用尖端技术提供市场上一些最高质量的图像生成结果,但他们的许多其他解决方案——包括人工智能驱动的升级,甚至使用机器学习的图像到图像迭代——已将 Stability AI 推向许多流程的主力工具,包括设计、动画和视频编辑。
示例 API 请求:
import base64
import requests
import os
url = "https://api.stability.ai/v1/generation/stable-diffusion-xl-1024-v1-0/text-to-image"
body = {
"steps": 40,
"width": 1024,
"height": 1024,
"seed": 0,
"cfg_scale": 5,
"samples": 1,
"text_prompts": [
{
"text": "an image of a person coding an API",
"weight": 1
},
{
"text": "blurry, dark",
"weight": -1
}
],
}
headers = {
"Accept": "application/json",
"Content-Type": "application/json",
"Authorization": "Bearer YOUR_API_KEY",
}
response = requests.post(
url,
headers=headers,
json=body,
)
if response.status_code != 200:
raise Exception("Non-200 response: " + str(response.text))
data = response.json()
# make sure the out directory exists
if not os.path.exists("./out"):
os.makedirs("./out")
for i, image in enumerate(data["artifacts"]):
with open(f'./out/txt2img_{image["seed"]}.png', "wb") as f:
f.write(base64.b64decode(image["base64"]))
5、ModelsLab API
ModelsLab 的主要价值主张是其 LLM 模型的深度和多样性。 ModelsLab 不仅提供自己的原生 LLM 模型用于图像生成,还允许社区上传自己的模型,从而实现前所未有的混合和扩展能力。
在更受控制和集中的分布中并不常见。虽然理论上这可能会影响长期质量,但这些模型通常是孤立的,允许比此列表中的其他产品更加定制和指令驱动的 LLM AI 文本到图像生成。
6、Monster API
Monster API 是一个独特的解决方案,因为驱动其 API 的是一个相对庞大(双关语)的网络。这种稳定的传播解决方案利用全球加密挖掘设备的分散计算来提供稳定、可扩展、全球本地化的图像生成解决方案。
这最终意味着 Monster 的图像生成更高效地利用资源,访问通常更加公平地民主化,让全球开发者能够以迄今为止主要在少数几个国家/地区孤立的方式使用 AI 生成功能。
示例 API 请求:
curl --request POST \
--url https://api.monsterapi.ai/v1/generate/txt2img \
--header 'accept: application/json' \
--header 'content-type: application/json'
7、Replicate API
Replicate 是一种强大的实现,这主要归功于它可以生成的材料范围之广。虽然 Replicate 可以以令人难以置信的准确性和质量创建文本到图像的结果,但它已使用此模型扩展到视频、语音甚至音乐生成。
这个多方面的系统还允许你微调输出,从而产生一个可以适应你的特定需求并在特定参数内生成图像的 API。因此,Replicate 是一种功能强大且可定制的解决方案,值得在任何工作流程中考虑。
8、DeepAI图像生成API
DeepAI 的图像生成 API 易于使用且设计简单。从很多方面来说,这既是它的吸引力,也是它的缺点。该工具易于使用、快速,并为其生成的图像的商业使用提供强大的免费许可。
也就是说,这是一个简单的解决方案,除了图像生成之外,它并没有提供太多功能。如果这是你需要的,它可以做到,但不要指望它能做更多的事情。
示例 API 请求:
curl \
-F 'text=YOUR_TEXT_HERE' \
-H 'api-key:YOUR_API_KEY' \
https://api.deepai.org/api/text2img
9、Hive图像生成API
Hive 的定位作为一家 AI 解决方案运营商,它通过 API 提供广泛的实现。虽然核心图像生成解决方案对开发人员和采用者来说仍然非常有价值,但基于该技术的其他工具(如审核工具、文本识别、洞察生成、文档 OCR 系统等)的加入使其成为许多大规模图像 AI 实现的基石。
示例 API 请求:
curl --location --request POST 'https://api.thehive.ai/api/v2/task/async' \
--header 'authorization: Token <YOUR_TOKEN>' \
--header 'Content-Type: application/json' \
--data-raw '{ "options": { "neg_text": "grass, pool", "num_images": 3 }, "text_data": "modern architecture house", "callback_url": "example_url" }'
10、Cloudlayer.io
Cloudlayer 是 AI 图像生成的业务特定实现,专注于创建图像驱动的营销和业务材料。这些材料当然包括图像之类的东西,但它们还提供从文本输入创建 PDF、用于结构化创建的预构建模板等等。
也许这个工具最好的部分是它可以获取 URL 并从中生成图像——这可以实现广泛的工作流程效率改进,并直接从预构建的结构生成图像。对于寻求比 meme-ish 艺术生成更强大的解决方案的企业来说,这是一个绝佳的解决方案,尽管与其他产品一样,采用相同的概念构建。
示例 API 请求:
curl --request POST \
--url https://api.cloudlayer.io/v2/html/image \
--header 'Content-Type: application/json' \
--header 'x-api-key: <YOUR-API-KEY>' \
--data '{
"html": "PGh0bWw+PGJvZHk+PGgxPkhlbGxvIHdvcmxkITwvaDE+PC9ib2R5PjwvaHRtbD4="
}' \
--output "response.json"
11、Améthyste API
近年来,最重大的转变之一是从平台解决方案转向更加分散和民主化的系统。 Améthyste API 延续了这一趋势,提供了一种具有非常具体形式和功能的 AI 图像生成解决方案:与 Discord 及其文化相关的表情包和图像。
虽然这种关注限制了它的使用,但它仍然是专门构建的超特定生成模型解决方案的完美示例,已成为许多 AI 提供商(包括 OpenAI)的新关注点。
12、Synthesia API
虽然 Synthesia 的核心产品传统上是视频生成,但值得注意的是,输出通常非常动态,可以拆分成单独的帧。因此,虽然它不是真正的文本到图像 AI 生成器,但它仍然可以作为一个生成器,通过相对强大的 API 为关键帧艺术、图像效果等创建可行的选项。
同样值得注意的是,Synthesia 拥有大量集成,这使其比其他单个产品更具优势。
示例 API 请求:
curl https://api.synthesia.io/v2/videos \
-H "Authorization: ${API_KEY}" \
-H "Content-Type: application/json" \ -X POST \
-d '{"test": true, "input": [{"scriptText": "Hello, World! This is my first synthetic video, made with the Synthesia API!", "avatar": "anna_costume1_cameraA", "background": "green_screen"}] }'
13、Bannerbear API
Bannerbear 是一款针对其消费者群体的利基解决方案。它专为电子商务和营销功能而构建,并且与营销工作流程和流程的集成使其成为该领域的杰出选择。
值得注意的是,Bannerbear 可以非常轻松地生成图像以及在生成后操纵和更改这些图像——此功能在其他强大的解决方案(如 DALL·E 3)中并不常见,这些解决方案通常可以在迭代过程中对图像进行相当大的更改,足以从营销角度将其视为一种新设计。
14、Eden AI
Eden AI 与此列表中的其他产品不同,它实际上并不是一个单一的 AI 图像生成器。它更像是利用机器学习和人工智能的专有和开放图像生成器集合的前端。
这一切的好处是 Eden 拥有完整的功能集,它既提供图像生成,又提供各种 OCR、面部识别、对象识别和通用检测解决方案,使其广泛适用于各种用例,而不仅仅是生成图像。
示例 API 请求:
curl --request POST \
--url https://api.edenai.run/v2/image/generation \
--header 'accept: application/json' \
--header 'content-type: application/json' \
--data'
{
"response_as_dict": true,
"attributes_as_list": false,
"show_original_response": false,
"resolution": "512x512",
"num_images": 2,
"providers": "stabilityai,amazon,deepai,replicate,openai",
"text": "A huge red balloon flying outside the city."
}
15、结束语
文本到图像 AI 生成模型是 LLM 驱动创作的前沿,此列表中的系统只会变得更好。这些功能强大的 API 为创意和专业材料开发提供了复杂的引擎,应该被视为未来几年媒体创作的宝贵来源。
我们是否遗漏了任何模型或解决方案?请在下面的评论中告诉我们!
汇智网翻译整理,转载请标明出处