一站式大模型API聚合平台🔴 https://DMXAPI.com 🚀 国内直连OpenAI、Claude、Gemini,💰注册送1美金!
推荐一个目前全网价格最实惠的合租平台,ChatGPT,MidJourney,奈飞,迪士尼,苹果TV等热门软件应有尽有 - https://dub.sh/unibus ,首单9折优惠 - 优惠码 01Coder
- 加入我的知识星球:https://t.zsxq.com/W5Oj7
- 关注我的Twitter: https://twitter.com/verysmallwoods
- 关注我的Bilibili: https://space.bilibili.com/615957867/
- 如果您有任何问题或者建议,欢迎通过邮件联系我:
[email protected]
Unsloth是一款非常流行的高效大模型训练与微调工具。本期视频演示如何完成模型的微调。视频中我会基于DeepSeek-R1-Distill-Llama-8B模型,利用医疗数据集 https://huggingface.co/datasets/FreedomIntelligence/medical-o1-reasoning-SFT 完成模型的微调。
大家觉得微调效果如何呢?
Documentation | Unsloth
https://docs.unsloth.ai/
Unsloth Fine-tuning DeepSeek R1 Distilled Llama 8B
https://colab.research.google.com/drive/1N0Sf9yn8Tjs5gMJv-rez-0hzxBUDK3xK?usp=sharing
如果您喜欢这个视频并希望请我喝一杯咖啡,欢迎前往我的BuyMeACoffee页面
👉 https://www.buymeacoffee.com/01coder