DeepSeek是啥?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”也是网上热议的“杭州六小龙”之一。
  • DeepSeek单周下载量高达约240万次,可能超过豆包在前一年春节期间通过广告投放达到的下载量;

  • 引发美股大跌的是两个模型DeepSeek-V3和DeepSeek-R1,前者是类4o模型,后者是类o1模型; 

  • DeepSeek-V3训练成本只有Llama 3的1%,DeepSeek-R1推理成本只有OpenAI o1的3%;

  • DeepSeek-V3的大量创新都与克服使用H800(而不是H100)所带来的内存和带宽不足有关;

  • R1系列模型放弃了RLHF的HF(人类反馈)部分,只留下纯粹的RL(强化学习),这个过程中模型涌现了「反思」能力;

  • DeepSeek还用其80万条思维链数据微调了阿里的Qwen模型,结果后者的推理能力也提升了;

  • DeepSeek尚未推出金融投资大模型,不过这只是时间问题。


DeepSeek的正确使用方式
请你扮演一位新能源行业分析师,按照以下步骤分析:
1. 市场规模
2. 竞争格局
3. 技术路线
4. 未来趋势
要求:每部分800字,引用权威数据...
我下周要和比亚迪的供应商谈判,但对动力电池不懂。
帮我用最通俗的语言说明:
1. 他们的技术优势在哪
2. 可能要价多少
3. 有什么谈判时能用的专业术语
重点是让我听得懂,能装得像内行

结果:DeepSeek直接给出接地气的分析,还附带谈判话术。

-end

__________________________

文章资料:央视网、 新皮层NewNewThing、鹤竹子 

如有侵权,请后台联系小编删除