图片模型已上线 · 文本和视频接入中

已上线图片模型,一个工作台

当前工作台已支持图片生成和下载。文本、视频和音频能力会在体验完善后逐步开放。

当前可在工作台直接使用的是图片生成模型。文本、视频和音频分类会保留价格与接入计划,但在状态变为“可用”前不会进入工作台扣费。

按功能选模型

先看适合什么,再看价格

推荐语会同步用于工作台选择模型卡片,帮助用户快速判断该选“快、准、高清、中文、编辑”里的哪一种。

📝 文本模型

GPT-5 可用
OpenAI
vision tools stream
输入 $2.50 / 1M tokens
输出 $10.00 / 1M tokens
GPT-5-mini 可用
OpenAI
vision tools stream
输入 $0.25 / 1M tokens
输出 $1.00 / 1M tokens
Claude Opus 4.7 可用
Anthropic
vision tools stream
输入 $15.00 / 1M tokens
输出 $75.00 / 1M tokens
Claude Sonnet 4.6 可用
Anthropic
vision tools stream
输入 $3.00 / 1M tokens
输出 $15.00 / 1M tokens
Claude Haiku 4 可用
Anthropic
vision tools stream
输入 $0.80 / 1M tokens
输出 $4.00 / 1M tokens
Gemini 2.5 Pro 可用
Google
vision tools stream
输入 $1.25 / 1M tokens
输出 $10.00 / 1M tokens
Gemini 2.5 Flash 可用
Google
vision tools stream
输入 $0.075 / 1M tokens
输出 $0.30 / 1M tokens
DeepSeek v4 可用
DeepSeek
tools stream
输入 ¥1.50 / 1M tokens
输出 ¥8.00 / 1M tokens
Qwen 3.5 Max 可用
Alibaba
vision tools stream
输入 ¥20.00 / 1M tokens
输出 ¥60.00 / 1M tokens
豆包 Pro 可用
ByteDance
vision tools stream
输入 ¥0.80 / 1M tokens
输出 ¥2.00 / 1M tokens
混元 Turbo 可用
Tencent
tools stream
输入 ¥2.40 / 1M tokens
输出 ¥9.60 / 1M tokens
Kimi K2 可用
Moonshot
stream
输入 ¥2.00 / 1M tokens
输出 ¥10.00 / 1M tokens
GLM-5 可用
智谱 AI
vision tools
输入 ¥5.00 / 1M tokens
输出 ¥15.00 / 1M tokens
Llama 4 405B Beta
Meta
tools stream
输入 $2.70 / 1M tokens
输出 $2.70 / 1M tokens
Mistral Large 3 可用
Mistral
tools stream
输入 $2.00 / 1M tokens
输出 $6.00 / 1M tokens
Grok 4 Beta
xAI
vision stream
输入 $5.00 / 1M tokens
输出 $15.00 / 1M tokens

🎨 图像模型

Nano Banana 可用
Google
edit i2i

文字准确,速度快,适合日常出图、商品图改造和快速试 prompt。

$0.039 / 张
Nano Banana Pro 可用
Google
edit i2i 高保真

最强图片模型,高保真细节,适合精修图、海报和关键交付。

$0.10 / 张
Nano Banana 2 Beta
Google
edit i2i v2

新版编辑能力,细节更稳,适合参考图延展和多轮改图。

$0.06 / 张
Imagen 4 可用
Google
t2i

审美稳定、画面干净,适合封面、视觉海报和通用营销图。

$0.040 / 张
GPT-Image-2 可用
OpenAI
edit i2i

图文一致性强,适合产品海报、带字设计和结构清晰的画面。

$0.080 / 张
Flux 1.1 Pro 可用
BFL
t2i

写实摄影质感强,适合人物、商业摄影和自然光产品图。

$0.040 / 张
Flux Schnell 可用
BFL
t2i fast

极低成本、速度快,适合批量草稿、灵感探索和快速 AB 对比。

$0.003 / 张
豆包 Seedream 可用
ByteDance
t2i i2i

中文理解友好,适合本土电商、人物场景和中文描述出图。

¥0.20 / 张
通义万相 v2.5 可用
Alibaba
t2i i2i

国风、插画和中文商业素材表现稳,适合品牌视觉扩展。

¥0.30 / 张
混元图像 可用
Tencent
t2i

通用中文出图模型,适合社媒配图、运营素材和轻量海报。

¥0.30 / 张
可图 Kolors 可用
Kuaishou
t2i

人物和风格化图像稳定,适合快手生态内容和竖版视觉。

¥0.30 / 张
CogView-4 可用
智谱 AI
t2i

中文 prompt 兼容性好,适合概念图、知识类插图和通用创作。

¥0.25 / 张
Recraft v3 可用
Recraft
t2i svg

图形设计和矢量风格友好,适合 logo、图标和品牌元素。

$0.04 / 张
SD 3.5 Large 可用
Stability
t2i

开源生态风格丰富,适合风格实验、摄影质感和概念探索。

$0.065 / 张
Ideogram v3 可用
Ideogram
text-in-image

文字入图能力突出,适合海报标题、标语图和排版类设计。

$0.08 / 张

🎬 视频模型

Sora 2 可用
OpenAI
t2v i2v audio
$0.50 / 秒
Veo 3.1 可用
Google
t2v i2v audio
$0.40 / 秒
可灵 v3 可用
Kuaishou
t2v i2v
¥2.00 / 秒
Vidu Q2 可用
ShengShu
t2v i2v
¥1.50 / 秒
Hailuo 02 可用
MiniMax
t2v i2v
¥1.80 / 秒
Runway Gen-4 可用
Runway
t2v i2v
$0.45 / 秒
Luma Ray 2 可用
Luma
t2v i2v
$0.30 / 秒
Pika 2.0 可用
Pika
t2v
$0.20 / 秒

🔊 音频模型

Whisper-3 可用
OpenAI
STT
$0.006 / 分钟
TTS-HD 可用
OpenAI
TTS
$30 / 1M 字符
ElevenLabs v3 可用
ElevenLabs
TTS clone
$0.18 / 1000 字符
Suno v4 Beta
Suno
music
$0.10 / 首
CosyVoice 2 可用
Alibaba
TTS clone
¥0.40 / 1000 字符

先用已上线图片模型创作

文本和视频会在接口稳定后开放;当前工作台不会展示未接入能力。