开发者专属
工业级大模型API现向所有开发者开放
过去,我们的 Token 仅向头部大厂批发;今天,我们将这套高并发、低延迟的推理服务开放给每一位开发者。无论是海量并发还是敏捷调用,深源智算 API 平台都能为您提供极致的性价比。
兼容主流调用格式
毫秒级首字延迟
弹性计费方案
访问 API 销售平台官网
即刻注册,获取免费试用额度
from openai import OpenAI
client = OpenAI(
api_key="your-api-key",
base_url="https://api.deepsprings.ai/v1"
)
response = client.chat.completions.create(
model="deepsprings-70b",
messages=[
{"role": "user", "content": "你好,请介绍一下深源智算"}
],
stream=True
)
for chunk in response:
print(chunk.choices[0].delta.content, end="")完全兼容 OpenAI SDK,一行代码即可切换
向下滚动了解更多
为开发者而生
简单易用,性能卓越
OpenAI 兼容格式
完全兼容 OpenAI API 格式,无需修改代码即可无缝迁移
超低延迟
针对推理场景深度优化,首字输出延迟低于 100ms
弹性扩容
自动负载均衡,支持突发流量,无需担心峰值压力
多模型支持
支持主流开源大模型,一个 API 调用多种能力
透明计费
按 Token 计费,价格透明,无隐藏费用
开发者友好
完善的文档和 SDK,丰富的代码示例