一站式大模型API聚合平台🔴 https://DMXAPI.com 🚀 国内直连OpenAI、Claude、Gemini,💰注册送1美金! 推荐一个目前全网价格最实惠的合租平台,ChatGPT,MidJourney,奈飞,迪士尼,苹果TV等热门软件应有尽有 - https://dub.sh/unibus ,首单9折优惠 - 优惠码 01Coder - 加入我的知识星球:https://t.zsxq.com/W5Oj7 - 关注我的Twitter: https://twitter.com/verysmallwoods - 关注我的Bilibili: https://space.bilibili.com/615957867/ - 如果您有任何问题或者建议,欢迎通过邮件联系我:[email protected] Unsloth是一款非常流行的高效大模型训练与微调工具。本期视频演示如何完成模型的微调。视频中我会基于DeepSeek-R1-Distill-Llama-8B模型,利用医疗数据集 https://huggingface.co/datasets/FreedomIntelligence/medical-o1-reasoning-SFT 完成模型的微调。 大家觉得微调效果如何呢? Documentation | Unsloth https://docs.unsloth.ai/ Unsloth Fine-tuning DeepSeek R1 Distilled Llama 8B https://colab.research.google.com/drive/1N0Sf9yn8Tjs5gMJv-rez-0hzxBUDK3xK?usp=sharing 如果您喜欢这个视频并希望请我喝一杯咖啡,欢迎前往我的BuyMeACoffee页面 👉 https://www.buymeacoffee.com/01coder