对于商用的高性能、高稳定、高并发、隐私保护等企业级需求,可进一步选择专属实例,包含云租赁和私有一体机两种版本,获取最佳API使用体验。支持多种NV机型,及昇腾等国产化算力,包月起订。欢迎您填写表单联系我们,感谢您的支持。
模型 | 算力型号 | 每套卡数 | 每套算力(FP16/TFLOPS) | 每套显存 (GB) | 模型精度 | 含算力部署总价 (万/套/月) |
---|---|---|---|---|---|---|
DeepSeek R1 671B | NV H800 | 16 | 31664 | 1280 | FP8 | 18 |
NV H200 | 8 | 15832 | 1128 | FP8 | 11 | |
NV H20 | 16 | 2368 | 1536 | FP8 | 8 | |
昇腾 910B | 32 | 10016 | 2048 | BF16 | 12 | |
DeepSeek V3 671B | NV H800 | 16 | 31664 | 1280 | FP8 | 18 |
NV H200 | 8 | 15832 | 1128 | FP8 | 11 | |
NV H20 | 16 | 2368 | 1536 | FP8 | 8 | |
昇腾 910B | 32 | 10016 | 2048 | BF16 | 12 | |
DeepSeek-R1-Distill-Llama-70B | 4090 | 8 | 1321 | 192 | BF16 | 1.2 |
H20 | 2 | 296 | 192 | BF16 | 1 | |
DeepSeek-R1-Distill-Qwen-32B | 4090 | 4 | 660 | 96 | BF16 | 0.6 |
H20 | 1 | 148 | 96 | BF16 | 0.5 | |
DeepSeek-R1-Distill-Qwen-14B | 4090 | 2 | 330 | 48 | BF16 | 0.3 |
H20 | 1 | 148 | 96 | BF16 | 0.5 | |
DeepSeek-R1-Distill-Qwen-8B | 4090 | 1 | 165 | 24 | BF16 | 0.15 |
DeepSeek-R1-Distill-Qwen-7B | 4090 | 1 | 165 | 24 | BF16 | 0.15 |
DeepSeek-R1-Distill-Qwen-1.5B | 4090 | 1 | 165 | 24 | BF16 | 0.15 |