Skip to main content
官方 API 服务

GLM 5 API

智谱 AI GLM-5 官方 API

一个 API 即可把前沿大模型接入你的应用。对话、编程、推理、智能体——200K 上下文、工具调用与流式输出,集成简单、定价透明。

统一 API
200K 上下文
流式输出
工具调用

什么是 GLM 5 API?

GLM 5 API 是智谱 AI GLM-5 大语言模型的官方 API 服务。一个 API Key 即可获得对话补全、长上下文推理(最高 200K token)、代码生成、工具调用与流式输出——无需自建基础设施,即可搭建助手、应用与自动化。

智谱 AI 提供 GLM 系列模型,以高性价比、生产可用的 API 著称。GLM 5 API 将同样的可靠性与透明定价带到最新模型,并提供 SDK 与文档,从注册到首次请求只需几分钟。

概览

一览

快速集成

REST API 与多语言 SDK,文档与示例齐全,从注册到首次请求只需几分钟。

对话与智能体

支持对话、工具调用与流式输出,可搭建客服机器人、助手与可规划执行的智能体。

200K 上下文

单次请求即可传入长文档、代码库或长对话,无需分段,模型看到完整上下文。

透明定价

按 token 计费、无绑定,相较同类前沿 API 更省成本,并提供免费额度。

核心能力

GLM 5 API 能做什么

一个 API 提供五大能力,按需选用,快速接入你的产品。

对话与内容

用于聊天界面、内容生成与文案撰写。统一接口,输出稳定、风格可控。

代码与调试

通过 API 做代码补全、生成与解释,可接入 IDE、CI 或自研开发工具。

推理

对长输入做多步推理,适用于分析、文档问答与结构化输出。

工具与智能体

API 支持工具调用与函数执行,可构建会查数据、调接口或执行代码的智能体。

长上下文

单次请求最高 200K token,可发送完整文档或长对话,无需切分。

使用场景

GLM 5 API 的用武之地

应用与对话

为产品增加对话或助手界面,一个 API 搞定对话、流式输出与历史。

代码与开发工具

将代码补全、生成或解释接入 IDE、脚本或 CI。

文档与内容

通过 API 从你的数据生成或总结文档、报告与营销文案。

智能体与自动化

构建可调用工具、查询接口或执行代码的智能体,支持长上下文与流式。

开发智能体办公文档长上下文任务

技术架构

GLM-5 如何构建

GLM-5 采用混合专家(MoE)架构,约 7450 亿总参数,256 个专家、每 token 激活 8 个(5.9% 稀疏率),每次推理 440 亿激活参数——规模约为前代 GLM-4.5 的两倍。模型采用 DeepSeek 稀疏注意力(DSA)实现高效长上下文处理,支持最长 200K token 序列而无需传统稠密注意力的算力开销。GLM-5 全程在华为昇腾芯片上使用 MindSpore 训练,实现从美国半导体硬件的完全独立。

总参数 约 7450 亿
激活参数 约 440 亿
专家配置 256 个 / 激活 8 个 (5.9%)
上下文长度 最高 200K token
注意力机制 DeepSeek 稀疏 (DSA)
训练硬件 华为昇腾

为什么选 GLM 5 API

竞争优势

GLM 5 API 让你用一套简单、可预期的接口,以有竞争力的价格使用前沿大模型。

  • 对话、编程、推理、工具调用一个 API 搞定,无需对接多家服务。
  • 单次请求支持 200K 上下文,长文档或长对话无需切分。
  • 支持流式与结构化输出,便于做实时 UI 与稳定管线。
  • 按量计费、价格透明,可免费额度起步,随用随扩。

开源与定价

获取方式与成本

GLM 5 API 是 GLM-5 模型在生产环境的官方使用方式。获取 API Key、调用接口、接入应用即可,无需自建与运维。

按 token 计费,价格在平台公开。用多少付多少,并提供免费额度试用。相较其他前沿 API,GLM 5 API 面向初创与企业在成本上更具优势。

发布时间线

关键节点

  • 2026 年 1 月 8 日 — 智谱AI 完成香港 IPO,募资约 43.5 亿港元(约 5.58 亿美元),用于新一代模型研发。
  • 2026 年 1 月 — GLM-5 在华为昇腾上训练接近完成,内部测试与评估启动。
  • 2026 年 2 月中旬 — GLM-5 通过 Z.ai 平台与 WaveSpeed API 开放使用,基准表现对标 Claude Opus 系列。
  • 2026 年 Q1 — 预期在 API 首发后推出 MIT 许可的开放权重版本。

快速开始

如何使用 GLM 5 API

1

获取 API Key

在 GLM 5 API 平台(或智谱开放平台)注册、创建项目并复制 API Key,免费额度无需绑卡。

2

调用 API

使用 REST API 或官方 SDK,发送 prompt 即可获得补全;可按需开启流式、工具调用或长上下文。

3

接入应用

将对话、代码辅助或智能体嵌入你的应用,文档与示例覆盖常用语言与框架。

常见问题

FAQ

什么是 GLM 5 API?

GLM 5 API 是智谱 AI GLM-5 大语言模型的官方 API 服务。通过一个 API 即可获得对话、编程、推理、工具调用与 200K 上下文能力,无需自建模型。

如何开始使用?

在平台注册、创建项目并复制 API Key,使用 REST API 或 SDK 发送 prompt 获取补全。文档与示例可快速完成集成。

可以做什么?

客服/对话机器人、代码助手、文档问答、带工具调用的智能体、内容生成等。凡需强语言理解与生成能力的场景均可使用 GLM 5 API。

如何计费?

按 token(输入与输出)计费。提供免费额度试用,正式使用按量月结。具体价格见平台公示,相较同类前沿 API 更具成本优势。

有免费额度吗?

有。新用户可获得免费额度,无需绑卡即可体验。需要扩容时再开通按量计费。

文档在哪里?

平台提供 API 文档、SDK 与示例代码,包括请求/响应格式、鉴权、流式与工具调用说明,便于快速接入。

开始使用 GLM 5 API

获取 API Key、阅读文档并发起首次请求。几分钟内即可在应用中接入对话、编程与智能体。

开始使用