本地部署使用 miniCpmV2-6 、chatglm 这些本地 LLM 的时候,如何实现统计 token?
使用智谱的 glm 在线服务的时候,会返回使用的 token:prompt_tokenscompletion_tokenstotal_tokens {代码...} 但是如果我是自己本地部署 chatglm、minicpm、qwen 这些模型,怎么统计 token 呢?示例代码 {代码...} 返回的 res 本身就是字符串了,而不是一个结构化对象这个统计 token 的方式,每个 llm 都一样吗?
1 回答2.7k 阅读
我不是太清楚如何明确的界定“经典算法”,算法是否经典貌似是个主观感受。我就说一下我了解的吧。
在推荐商品的时候可能会用到: 协同过滤推荐算法(Collaborative Filtering recommendation)
在使用缓存和分布式中一般会用到: 一致性hash算法(consistent hashing)
欢迎大家补充。