Codia
返回文章列表

开放 API 与 Codia 开发生态

Developer Platform2026-04-22

为什么 Codia 提供 API

Codia 产品把视觉内容转换为可编辑、结构化的资产。API 面向的是想把同样能力接入自己产品、迁移脚本、智能体工作流、QA 系统或设计自动化管线的团队。

开发者平台围绕一个简单想法:视觉输入应该变成软件可以理解的结构化数据。

面向图像的 Visual Struct

Visual Struct 图像端点把 UI 截图或 mockup 转换成一棵层级 JSON 树。

http
POST https://api.codia.ai/v1/open/image_to_design

响应中包含 header、button、card、table、chart、icon、text、panel 等有类型的元素。节点包含边界框、布局配置、置信度元数据和子元素。

文档描述了三种输出格式:

  • json:用于自定义下游管线
  • svg:用于不绑定设计工具的矢量重渲染
  • figma:用于通过插件或导入流程插入 Figma 文件

当截图、UI mockup 或视觉参考需要变成机器可读数据时,用这个 API。

PDF to Visual Struct

PDF 使用相关端点:

http
POST https://api.codia.ai/v1/open/pdf_to_design

该端点把 PDF 页面转换成 Codia 的 Visual Element Schema:包含边界框、布局配置、样式规格和子元素的有类型层级结构。它和图像 Visual Struct 共享同一套 schema 形状,因此下游系统可以用同一种处理模型支持图像和 PDF。

文档列出的常见用途包括 Figma 导入器、代码生成器、视觉 QA 管线和渲染工作流。

上传与任务工作流

对于需要私有文件处理或长任务的场景,已有 Open API 内容描述了上传 + 任务的模式:

  • 上传私有文件到 /v1/open/uploads
  • 获取不透明的 upload_id
  • 通过 /v1/open/tasks 创建任务
  • 接收 webhook 事件或轮询任务状态
  • 任务完成后下载生成结果

NotebookLM-style PDF 转可编辑 PPTX 的文章就用这个模式实现服务端 PDF-to-PowerPoint 自动化。关键实现规则是:Codia API key 只放在服务端,不发送到浏览器。

开发者可以构建什么

当团队需要把结构化视觉理解嵌入另一个系统时,API 很有用:

  • 竞品 UI 归档与分析
  • 设计系统审计
  • 自动化视觉 QA 与回归检查
  • 截图转 Figma 导入流程
  • PDF-to-schema 提取
  • 代码生成前处理
  • 需要机器可读 UI 结构的智能体工作流
  • 大型设计归档的批量迁移工具

输出不只是带标签的截图,而是一棵可以过滤、转换、渲染、导入或继续交给另一个模型处理的树。

集成边界

公开文档对几个实际边界说得很清楚:

  • API 调用需要 Bearer token 认证。
  • 某些上传会先检查 credits,再读取文件。
  • 输出质量取决于源文件清晰度和布局复杂度。
  • 超长截图按区块切分后调用,顶层分组会更稳定。
  • 下游使用前应过滤低置信度节点。
  • 企业部署可以讨论保留期限、生产用量、更高限额和私有部署需求。

这些边界本身也是开发者体验的一部分。可靠的 API 应该把取舍说清楚。

从哪里开始

截图和 mockup 从 Visual Struct 开始。PDF 从 PDF to Visual Struct 开始。完整 endpoint schema 和请求/响应字段见 API Reference

相关阅读

#open-api#visual-struct#developer-api#json#automation