Doge 资讯 - 聚焦狗狗币动态，掌握加密货币前沿信息 - 第58页 - Dogely Crypto

计科趣闻 | 玩转DeepSeek：大模型学习指南+避坑攻略

前言 preface 同学们，假期快乐。过年期间，相信大家已经被国产的DeepSeek这款人工智能大模型刷屏，随着人工智能的迅猛发展，DeepSeek成为了一款炙手可热的大语言模型（LLM）。但许多同学对它的认识还停留在“聊天机器人”阶段，或误以为它能“无所不知”。那么，DeepSeek 真的如此神奇吗？大学生该如何正确认识和使用它？如果想从事 LLM 研究，又该如何入门？今天

Doge资讯 2025-02-23 46 阅读
震惊 AI 界！DeepSeek

刚看完DeepSeek R1技术报告论文《DeepSeek-R1：强化学习驱动的大语言模型推理能力提升》，这篇论文最令人震惊的点在于： DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调（SFT）数据，仅通过纯粹的强化学习（RL）训练的模型，展现出了惊人的推理能力，推理基准测试上可以媲美乃至超越 OpenAI 的 o1 系列模型（如 o1-0912），完全开源

Doge资讯 2025-02-23 48 阅读
DeepSeek R1：纯强化学习的逆袭之路

“又来一个 AlphaZero 时刻！”这句话或许会在科研圈中引起共鸣。DeepSeek 团队靠着炫酷的纯强化学习（RL），在数学与代码这种双螺旋（Chain-of-Thought）的数据上下一番苦功，催生出了堪比闭源模型的 Reasoning 大牛——R1-Zero。在一片“脑洞大开”的 RL 热潮中，他们不仅找到了激发模型推理能力的秘诀，还为全世界用户呈现了模型在回答问题前的“内心独白”

Doge资讯 2025-02-23 44 阅读
DeepSeek爆火真相：不靠“人盯”，让AI自己学会慢思考

本文整理自InfoQ策划的DeepSeek系列直播第二期节目——DeepSeek爆火背后DeepSeek，纯强化学习路线到底有何不同。在直播中，出门问问大模型团队前工程副总李维博士聚焦推理范式的创新，分析了R1 Zero 对推理模型平民化的创新贡献。他提到，DeepSeek通过开源和透明化，证明了不需要过程监督，仅通过结果控制就能训练出优秀的推理模型，这大大颠覆了传统认知以及OpenAI

Doge资讯 2025-02-23 48 阅读
DeepSeek服务器繁忙问题的原因分析与解决方案(最新推荐)

一、引言随着人工智能技术的飞速发展，DeepSeek 等语言模型在众多领域得到了广泛应用。然而，在春节这段时间的使用过程中，用户常常遭遇服务器繁忙的问题，这不仅影响了用户的使用体验，也在一定程度上限制了模型的推广和应用。因此，深入研究这一问题并寻求有效的解决方案具有重要的现实意义。二、原因分析 2.1、用户流量 2.1.1、用户量激增当 DeepSeek 有新模型上线

Doge资讯 2025-02-22 61 阅读
【一文读懂】Deepseek

本文内容来自Deepseek官方的技术论文: 【1】DeepSeek-V3 Technical Report. [2412.19437] DeepSeek-V3 Technical Report. 图一. DeepSeek的《DeepSeek-V3》论文截图 DeepSeek-V3 的核心技术展示了其在大规模模型设计和优化方面的创新性。以下是对其主要技术特点的解读：一

Doge资讯 2025-02-22 51 阅读
万字详解 DeepSeek

TL;DR 2024 年中国 deepseek 发表的轰动全球的大模型论文。DeepSeek-V3 是目前开源 LLM 领域的新巅峰，在保持高性能的同时，训练成本远低于 GPT-4o。DeepSeek-V3 在数学、编程、逻辑推理和长文本处理方面表现极其出色，它采用了MoE 架构、长文本优化和高效训练方法。 Paper name DeepSeek-V3 Technical Report

Doge资讯 2025-02-22 69 阅读
DeepSeek系统架构的逐层分类拆解分析，从底层基础设施到用户端分发全链路

一、底层基础设施层 1. 硬件服务器集群算力单元： GPU集群：基于NVIDIA H800/H100 GPU构建，单集群规模超10,000卡，采用NVLink全互联架构实现低延迟通信。国产化支持：适配海光DCU、寒武纪MLU等国产芯片，通过澎峰科技PerfXLM+框架优化算力利用率。存储架构：分布式存储：采用Ceph或GlusterFS实现PB级模型参数存储

Doge资讯 2025-02-22 49 阅读
探秘DeepSeek动态偏置调整机制：解锁AI性能优化密码

引言在人工智能领域迅猛发展的当下，大语言模型已成为推动自然语言处理进步的关键力量。从 GPT-4 引发的全球关注，到各类开源模型的百花齐放，技术的迭代速度令人目不暇接。在这个充满创新与竞争的赛道上，DeepSeek 以其独特的技术架构和创新理念，逐渐崭露头角。而其中的动态偏置调整机制，更是 DeepSeek 技术体系中的一颗璀璨明珠，为提升模型性能和效率开辟了新的道路

Doge资讯 2025-02-22 61 阅读
DeepSeek如何具体分析和优化饲料配比？

DeepSeek在分析和优化饲料配比方面，主要通过其强大的AI模型和相关技术实现。以下是具体分析和优化饲料配比的方法：数据处理与模型训练 DeepSeek采用了先进的数据处理方法，包括去重、过滤和混合策略，以提高数据的多样性和质量。这种精细化的数据处理方式能够确保输入模型的数据更加准确和全面，从而为饲料配比的优化提供可靠的基础。多阶段训练与冷启动数据 DeepSeek引入了多阶段训练方法

Doge资讯 2025-02-22 83 阅读

第一页上一页 1 ... 57 58 59 ... 72 下一页尾页

推荐服务

Telegram粉丝购买

Tiktok涨粉平台

文章分类

热门文章