康哥的博客

康哥的博客

AI教程

大模型Token打骨折:DeepSeek百万Token只需1元——谈谈大模型中常用的量化操作对成本影响

大模型Token打骨折:DeepSeek百万Token只需1元——谈谈大模型中常用的量化操作对成本影响

1 大模型中的量化操作 在 GPT-3 之后, NLP 领域进入了由 pretrain + prompt 的范式代替 pretrain + fine-tuning 的 Bert 范式的时代. 从目前 ChatGPT 按 token 收费的情况来看, 每 token 推理成本的摊销将会决定产品定价和背
32
0
0
2024-05-09