内容简介:各位小伙伴们大家好哈。 DeepSeek R1火了之后,模型蒸馏 这个词儿也跟着火了。 一方面, OpenAI暗戳戳的(其实已经算明指了)表示DeepSeek就是用GPT的数据来做的蒸馏(别人说你起诉啊,OpenAI又说不);另一方面, 的确真有很多知名的公司利用R1版模型蒸馏出更多小模型,有基于Llama的,也有基于Qwen的,效果都不错。 所以今天我们就来聊聊何为模型蒸馏? 一...
用户评论
推荐服务