Token Factory Unit Economics

基于中金研究报告，本模型通过模拟 NVIDIA NVL72 (GB200) 机柜的生产效能，评估大模型厂商作为“Token 工厂”的全球 ROI。您可在左侧自由切换自建或租赁算力，观察顶级美元硬件底座的单位生存红线。

🧮

一、NVIDIA基座单位经济学底层数学引擎与实时推导

重资产/高租金模式下，平摊英伟达算力成本的秘密在于“高吞吐量”与“极致资源利用率”的对冲（数值随左侧滑块实时动态计算代入）：

STEP 1. 年化总拥有成本

TCO_annual 公式

公式: 加权固资折旧 + 年度运营电费 + 年度维护

加权折旧: 0 M$
年度电费: 0 M$
管理维护: 0 M$

= TCO: 0 百万美元/年

STEP 2. 有效 Token 年总产出

Output_actual 实际年吞吐公式

公式: (单卡速率 × 72卡 × 全年秒数) × 有效利用率

单卡速率: 0 T/s
集群规模: 72 颗 GB200
有效利用率: 0%

= 实际年产量: 0 万亿 Tokens

STEP 3. 每百万Token核心单位成本

CPMC 综合单位成本公式

公式: (TCO_annual / Output_annual_M) × 1,000,000

年化成本: 0 美元
年总产量: 0 百万Tokens
高额 Capex 正在被庞大的吞吐分摊...

单位成本: $0.00 / 百万Tokens

平均每百万Token成本

$1.95

基于自建 Capex 测算

理想毛利率

61%

Token Factory 模式

年总 Token 产出

0.91T

万亿级别参数模型

预计盈亏平衡年限

Year 5

整体经营性损益

算力成本配置

算力获取模式切换

收入与定价模型

单位成本结构拆解 (每百万 Tokens)

显示各项折旧与运营开支对最终单位成本的边际贡献度

$1.95

8年长期经营仿真利润曲线 (P&L 趋势)

根据中金 Table 7 模型推演：模拟推理规模爆发式膨胀对前期巨额训练研发投入的平摊走势

💡 Agent 渗透率影响传导

当前主要由 Chatbot 驱动。此时输入输出比约为 2:1，单位 Token 价格较高。随着 Agent 渗透，模型将承担更多逻辑链推理，关注重点应从单价转向总吞吐量带来的成本摊薄。

⚙️ 核心财务逻辑：Token 工厂模型

英伟达高 Capex 算力中心（NVL72集群）的中长期盈亏平衡（Break-even）取决于：
1. 推理规模复用率：长尾推理毛利必须尽快覆盖昂贵的前期研发与卡片折旧。
2. 摩尔定律对冲：芯片吞吐效率（Tokens/s）的每一次跨代提升，都相当于间接实现单Token生产成本的减半。
3. 业务粘性转换：逐步从单纯按量卖Token向按Agent结果计费的商业稳态靠拢。