IT营社区是IT营（www.itying.com）旗下的IT技术交流社区。我们致力于IT全栈(Flutter、鸿蒙、Go语言、Nodejs、前端、Linux、Docker K8s)在中国的研究、学习、推广工作，为中国百万开发者提供技术源动力。

积分: 186830

“ 这家伙很懒，什么个性签名都没有留下。 ”

5 / 43071 1 年前

DeepSeek功能请求：按项目分组聊天并添加记忆功能

5 / 43680 1 年前

DeepSeek在浏览器使用中未提供服务的反馈

2 / 6951 1 年前

如何跳转到发短信页面（HarmonyOS 鸿蒙Next）

5 / 9933 1 年前

Deepseek MoE仅加载激活专家到GPU的优化方案

5 / 7434 1 年前

Deepseek关于'冷启动数据'的详细澄清

5 / 4809 1 年前

Deepseek单个提示是否会激活推理推断中不同专家组的讨论

5 / 16044 1 年前

Deepseek在深度思考（R1）模式下耗时过长的优化方案

5 / 9177 1 年前

Deepseek在Windows ARM平台上使用GPU/NPU驱动的教程

5 / 15372 1 年前

Deepseek模型在回答文本中未正确加粗的修复建议

5 / 8757 1 年前

Deepseek无限循环问题的排查与解决

5 / 7329 1 年前

Deepseek ImportError: 无法导入'is_torch_greater_or_equal_than_1_13'的解决方案

5 / 5502 1 年前

关于Deepseek-R1蒸馏过程的疑问与解答

5 / 6846 1 年前

Deepseek网站开发问题及改进建议

5 / 21861 1 年前

Deepseek功能请求：为AI聊天模型添加语音聊天功能

5 / 6405 1 年前

建议再发布一个Deepseek-R1的直接量化版本

5 / 6132 1 年前

DeepSeek 提议添加一个官方微调脚本

5 / 9702 1 年前

DeepSeek 请求官方出一个4bit的量化版本，并附带模型的效果指标

5 / 6090 1 年前

DeepSeek 请问后续能否推出DeepSeek R1-Distill-Qwen-72B模型呢？Llama3.3-70B-Instruct对中文支持不友好

5 / 11886 1 年前

DeepSeek 使用TensorRT-LLM进行推理R1

5 / 4872 1 年前

DeepSeek 关于R1详情的询问：有关R1-Zero训练数据/训练策略对比/冷启动性能的信息

5 / 4557 1 年前

DeepSeek 是否应该避免使用系统提示？

5 / 8148 1 年前

DeepSeek [功能请求] 在思考过程中提供搜索接口

5 / 8232 1 年前

DeepSeek api能调用本地的知识库吗

5 / 20790 1 年前

调用DeepSeek-reasoner模型（DeepSeek-R1）通过API时响应不稳定，如何解决？

5 / 6678 1 年前

关于DeepSeek RAG自建知识库检索问题，如何解决？

5 / 7812 1 年前

ChatU第一时间集成了DeepSeek-R，企业如何开户体验？

5 / 6720 1 年前

如何重现DeepSeek R1-671B模型在AIME2024上的性能？

5 / 6720 1 年前

怎样才能确保相同输入内容，多次生成的结果完全一致？

5 / 12810 1 年前

无法加载DeepSeek-R1-Distill-Llama-70B with VLLM，如何解决？

5 / 23142 1 年前

本地部署DeepSeek-R1-Distill-Qwen-32B，输出仅有</think>，没有<think>怎么办？

5 / 6363 1 年前

[Feature Request] DeepSeek模型版本是否兼容NVIDIA A100 (Ampere架构)或其他部署方法？

5 / 6888 1 年前

DeepSeek-R1模型在HuggingFace Hub上的情况如何？

5 / 5838 1 年前

探索DeepSeek等大模型的落地应用场景有哪些？

5 / 8400 1 年前

DeepSeek R1 API是否有速率限制？

5 / 5124 1 年前

DeepSeek R1支持哪些云服务平台？

5 / 11592 1 年前

为什么DeepSeek R1返回的结果不完整？

5 / 10458 1 年前

训练DeepSeek R1模型大约需要多少时间？

5 / 6636 1 年前

DeepSeek中隐藏状态信息是如何处理的？

5 / 19803 1 年前

使用Google账号登录DeepSeek服务时遇到问题，该如何解决？

5 / 15876 1 年前

DeepSeek内置的农历和公历转换算法有误，该如何修正？

5 / 8799 1 年前

如何理解建议：我们推荐让模型在每个输出开始时以'<think> '开头？

5 / 8316 1 年前

本地推理DeepSeek R1需要多少硬件资源？

5 / 5397 1 年前

本地部署DeepSeek时感觉不对劲，应该如何排查？

5 / 4578 1 年前

是否有针对DeepSeek-R1模型的后训练方法或仓库，而不是基于蒸馏模型？

5 / 5334 1 年前

DeepSeek-R1 是否支持实时推理？

5 / 9387 1 年前

如何解决 DeepSeek-R1 在编程任务中的代码生成错误？

回到顶部