产品与解决方案 / 智能计算PDT / AI开发部

华鲲大模型算力集群盈亏平衡计算器 v2.4.4

基于多维变动成本与大厂 API 价格获客防线的商业化精算决策大屏

1. 硬件与 CapEx 区 总资产: 0.00 万元 | 年折旧: 0.00 万元
集群服务器台数 (N_server) 8
1 台 384 台
单台服务器采购价 (Price_server)
单位:万元 / 台
配套网络与组网资产 (Price_network)
单位:万元 (用于计算 CapEx 总额)
选配存储与常规硬件资产 (Price_storage)
单位:万元 (用于计算 CapEx 总额)
折旧年限红线 (Years_depreciation)
2. 物理运营成本区 月OPEX: 0.00 万元 | 年电费: 0.00 万元
单台满载功耗 (Power_server)
单位:kW
机房 PUE 指标系数 (PUE) 1.30
工业电费单价 (Price_electricity)
单位:元 / kWh
单个机柜月租金 (Price_cabinet)
单位:元 / 月 / 台
公网带宽月费 (Bandwidth_monthly)
单位:元 / 月
人工技术运维分摊 (Ops_monthly)
单位:元 / 月
3. 政策与资金补贴区 年总补贴: 0.00 万元
🏢 政府扶持补贴
政府设备采购补贴率 (Gov_subsidy_hardware) 0%
0% (无补贴) 50% (补一半)
政府年度运营财政补贴 (Gov_subsidy_ops)
单位:万元 / 年
⚡ 运营商协议补贴
运营商电费现金补贴率 (Carrier_subsidy_elec) 0%
0% (无减免) 50% (电费减半)
网络租赁带宽费折扣率 (Carrier_subsidy_network) 0%
0% (无折扣) 50% (宽带费减半)
4. 营收与销售定价区 混合均价: 0.000 元/M | 年营收: 0.00 万元
大模型基准选择 (Model Preset)
输入未命中: 4.00 元/M 缓存命中: 0.50 元/M 输出: 12.00 元/M
部署建议: 昇腾 910B (64GB) 私有部署推荐:FP16需 4台 | FP8需 2台 (使用 PP=4, TP=8 混合并行)
对外输入售价 (P_sales_input) 3.00
对外输出售价 (P_sales_output) 12.00
对外缓存售价 (P_sales_cache) 0.80
输入 Token 占比 (Ratio_input) 80%
缓存命中率 (Ratio_cache) 30%
5. 模型吞吐性能极限 混合吞吐: 0 Tok/s
启用服务的 PD 分离部署
输入 Prefill 吞吐速率 (T_prefill)
单位:Tokens / s
输出 Decoding 吞吐速率 (T_decoding)
单位:Tokens / s
综合故障停机率 (Alpha_fail) 5%
6. 多模型混合部署配置 混合部署: 未启用
启用多模型子集群混合部署
系统当前实际算力利用率 (U_rate) 30%
0% (空载) 100% (满载)
正在评估算力防御线...
月度运营成本 (OpEx)
0.00 万元/月
自建盈亏平衡售价
0.00 元/百万
保本利用率 (U_BEP)
0.0% 保本临界
预计年净利润 (P_net)
0.00 万元/年
回本周期: 计算中...

已选集群参数与物理环境可视化汇总看板

物理设施与 CapEx
集群总台数: 8 台
单机售价: 140 万元
网络/存储选配: 0.0/0.0 万元
净 CapEx 投资: 1120.00 万元
物理运营与补贴
运行 PUE: 1.30
电费单价: 0.80 元/度
建补: 0% | 运直补: 0万
电补: 0% | 网折: 0%
算力效能与模型
服务的PD分离: 未启用
算力折损率: 5%
模型: DeepSeek-R1 (8台)
负载率与销售定价
负载利用率 U: 30%
自建销售均价: 3.22 元/M
大厂官方限价: 4.50 元/M
自建平衡单价 vs 大厂官方定价红线对比曲线
自建盈亏平衡售价 (随负载下降)
自建 Token 对外折合销售均价
大厂官方折合 API 价格红线
负载分摊建议售价 (当前负载)
华鲲智算集群商业精算逻辑与因子定义字典
底层链式数学公式组 (LaTeX 排版数学内核)
1. 资产总值 (CapEx)
$$CapEx = (Price_{server} \times N_{server}) + Price_{network}$$
整个算力节点与组网资产采购的总资本性支出(未扣除补贴)。
等待计算...
2. 年固定资产折旧 (D_CapEx)
$$D_{CapEx} = \frac{CapEx \times (1 - Subsidy_{hardware})}{Years_{depreciation}}$$
依据折旧年限红线将扣除硬件建设补贴后的净资产进行等额年折旧分摊。
等待计算...
3. 年运营成本 (OpEx_annual)
$$OpEx_{annual} = PowerCost \times (1 - Subsidy_{elec}) + CabinetCost + BandwidthCost + OpsCost - Subsidy_{annual\_ops}$$
包含算力电费(扣除电费补贴)、机柜租金、独享宽带和人工运维,再扣减财政运营年补贴。
等待计算...
4. 混合吞吐速率 (T_speed)
$$T_{speed} = \frac{1}{\frac{Ratio_{input}}{T_{prefill}} + \frac{1 - Ratio_{input}}{T_{decoding}}}$$
基于输入(Prefill)与输出(Decoding)极限速率以及流量占比动态求解的混合吞吐速率。
等待计算...
5. 集群最大 Token 年产能 (M_annual)
$$M_{annual} = \frac{T_{speed} \times 86400 \times 365 \times (1 - Alpha_{fail})}{1,000,000}$$
结合混合吞吐极限与综合停机率,计算集群在 100% 负载率下的理论极限 Token 年产能。
等待计算...
6. 对外折合混合销售均价 (P_sales_blended)
$$P_{sales\_blended} = \left[ P_{cache} \times Ratio_{cache} + P_{input\_miss} \times (1 - Ratio_{cache}) \right] \times Ratio_{input} + P_{output} \times (1 - Ratio_{input})$$
将输入售价(拆分为缓存命中售价与未命中售价)和输出售价按流量占比进行三轨加权折算。
等待计算...
7. 实际年净利润 (P_net)
$$P_{net} = (M_{annual} \times U_{rate} \times P_{sales\_blended}) - OpEx_{annual} - D_{CapEx}$$
年总营业额减去年度运营成本 (扣减补贴后) 与年折旧额后的最终经营损益。
等待计算...
8. 盈亏平衡点利用率红线 (U_BEP)
$$U_{BEP} = \frac{OpEx_{annual} + D_{CapEx}}{M_{annual} \times P_{sales\_blended}}$$
自建算力达致盈亏平衡时的临界利用率。低于该红线集群将处于净亏损状态。
等待计算...
9. 纯现金流回本周期 (T_cash_back)
$$T_{cash\_back} = \frac{CapEx \times (1 - Subsidy_{hardware})}{R_{gross} - OpEx_{annual}}$$
使用总营业额扣除年运营开销后的纯现金流,回收扣除补贴后的硬件净投入的预计年限。
等待计算...
动态输入因子定义库 (变量释义字典)
N_server 集群内配置的 GPU/NPU 物理服务器台数。
Price_server 单台服务器采购单价,包含内置算力显卡等分摊。
Price_network 配套交换机、RDMA高速光纤等配套组网资产总额。
Years_depreciation 固定资产的折旧摊销年限(影响年折旧底座的生存硬开销)。
Power_server 单台服务器的额定满载功耗 (单位:kW)。
PUE 数据中心电源使用效率指标。PUE越趋近于1说明空调用电等杂电损耗越小。
Price_electricity 数据中心托管地的工业用电单价 (元/kWh)。
Price_cabinet 高电密机柜单月托管费。计算中默认单台服务器占用单个机柜。
Bandwidth_monthly 集群向外提供公网 API 零售服务时所需的月度宽带费。
Ops_monthly 集群托管机房的月度人工巡检与基础运维外包等分摊费。
T_speed 当前模型在物理集群上满载并发时的最大吞吐速率。
Alpha_fail 集群因网络丢包、坏卡或系统故障等导致的年均不可用时间占比。
P_official_input DeepSeek 官方 API 输入 Token 的标准单价(元/百万 Tokens)。
P_official_output DeepSeek 官方 API 输出 Token 的标准单价(元/百万 Tokens)。
P_official_blended DeepSeek 官方 API 按输入占比折合后的混合单价红线(获客门槛)。
P_sales_input 我们自建对外销售的输入 Token 单价(可通过滑块调节)。
P_sales_output 我们自建对外销售的输出 Token 单价(可通过滑块调节)。
P_sales_blended 我们自建对外销售 Token 服务的加权折合实际混合平均售价。
Ratio_input 输入 Token 占整体消耗 Token 的百分比(通过比例滑块调节)。
U_rate 集群在全年中实际运行并产生算力营业额的时间占比(算力利用率)。