对于商用的高性能、高稳定、高并发、隐私保护等企业级需求,可进一步选择专属实例,包含云租赁和私有一体机两种版本,获取最佳API使用体验。支持多种NV机型,及昇腾等国产化算力,包月起订。欢迎您填写表单联系我们,感谢您的支持。

模型算力型号每套卡数每套算力(FP16/TFLOPS)每套显存 (GB)模型精度含算力部署总价 (万/套/月)
DeepSeek R1 671BNV H80016316641280FP818
NV H2008158321128FP811
NV H201623681536FP88
昇腾 910B32100162048BF1612
DeepSeek V3 671BNV H80016316641280FP818
NV H2008158321128FP811
NV H201623681536FP88
昇腾 910B32100162048BF1612
DeepSeek-R1-Distill-Llama-70B409081321192BF161.2
H202296192BF161
DeepSeek-R1-Distill-Qwen-32B4090466096BF160.6
H20114896BF160.5
DeepSeek-R1-Distill-Qwen-14B4090233048BF160.3
H20114896BF160.5
DeepSeek-R1-Distill-Qwen-8B4090116524BF160.15
DeepSeek-R1-Distill-Qwen-7B4090116524BF160.15
DeepSeek-R1-Distill-Qwen-1.5B4090116524BF160.15