首页
Golang全栈
Flutter全栈
鸿蒙全栈
Ai全栈
IT营·研究院
个人信息
songsunli
积分: 186830
“ 这家伙很懒,什么个性签名都没有留下。 ”
热门技术
主页
/
songsunli的主页
songsunli 参与的话题
5
/
43071
1 年前
DeepSeek功能请求:按项目分组聊天并添加记忆功能
5
/
43680
1 年前
DeepSeek在浏览器使用中未提供服务的反馈
2
/
6951
1 年前
如何跳转到发短信页面(HarmonyOS 鸿蒙Next)
5
/
9933
1 年前
Deepseek MoE仅加载激活专家到GPU的优化方案
5
/
7434
1 年前
Deepseek关于'冷启动数据'的详细澄清
5
/
4809
1 年前
Deepseek单个提示是否会激活推理推断中不同专家组的讨论
5
/
16044
1 年前
Deepseek在深度思考(R1)模式下耗时过长的优化方案
5
/
9177
1 年前
Deepseek在Windows ARM平台上使用GPU/NPU驱动的教程
5
/
15372
1 年前
Deepseek模型在回答文本中未正确加粗的修复建议
5
/
8757
1 年前
Deepseek无限循环问题的排查与解决
5
/
7329
1 年前
Deepseek ImportError: 无法导入'is_torch_greater_or_equal_than_1_13'的解决方案
5
/
5502
1 年前
关于Deepseek-R1蒸馏过程的疑问与解答
5
/
6846
1 年前
Deepseek网站开发问题及改进建议
5
/
21861
1 年前
Deepseek功能请求:为AI聊天模型添加语音聊天功能
5
/
6405
1 年前
建议再发布一个Deepseek-R1的直接量化版本
5
/
6132
1 年前
DeepSeek 提议添加一个官方微调脚本
5
/
9702
1 年前
DeepSeek 请求官方出一个4bit的量化版本,并附带模型的效果指标
5
/
6090
1 年前
DeepSeek 请问后续能否推出DeepSeek R1-Distill-Qwen-72B模型呢?Llama3.3-70B-Instruct对中文支持不友好
5
/
11886
1 年前
DeepSeek 使用TensorRT-LLM进行推理R1
5
/
4872
1 年前
DeepSeek 关于R1详情的询问:有关R1-Zero训练数据/训练策略对比/冷启动性能的信息
5
/
4557
1 年前
DeepSeek 是否应该避免使用系统提示?
5
/
8148
1 年前
DeepSeek [功能请求] 在思考过程中提供搜索接口
5
/
8232
1 年前
DeepSeek api能调用本地的知识库吗
5
/
20790
1 年前
调用DeepSeek-reasoner模型(DeepSeek-R1)通过API时响应不稳定,如何解决?
5
/
6678
1 年前
关于DeepSeek RAG自建知识库检索问题,如何解决?
5
/
7812
1 年前
ChatU第一时间集成了DeepSeek-R,企业如何开户体验?
5
/
6720
1 年前
如何重现DeepSeek R1-671B模型在AIME2024上的性能?
5
/
6720
1 年前
怎样才能确保相同输入内容,多次生成的结果完全一致?
5
/
12810
1 年前
无法加载DeepSeek-R1-Distill-Llama-70B with VLLM,如何解决?
5
/
23142
1 年前
本地部署DeepSeek-R1-Distill-Qwen-32B,输出仅有</think>,没有<think>怎么办?
5
/
6363
1 年前
[Feature Request] DeepSeek模型版本是否兼容NVIDIA A100 (Ampere架构)或其他部署方法?
5
/
6888
1 年前
DeepSeek-R1模型在HuggingFace Hub上的情况如何?
5
/
5838
1 年前
探索DeepSeek等大模型的落地应用场景有哪些?
5
/
8400
1 年前
DeepSeek R1 API是否有速率限制?
5
/
5124
1 年前
DeepSeek R1支持哪些云服务平台?
5
/
11592
1 年前
为什么DeepSeek R1返回的结果不完整?
5
/
10458
1 年前
训练DeepSeek R1模型大约需要多少时间?
5
/
6636
1 年前
DeepSeek中隐藏状态信息是如何处理的?
5
/
19803
1 年前
使用Google账号登录DeepSeek服务时遇到问题,该如何解决?
5
/
15876
1 年前
DeepSeek内置的农历和公历转换算法有误,该如何修正?
5
/
8799
1 年前
如何理解建议:我们推荐让模型在每个输出开始时以'<think> '开头?
5
/
8316
1 年前
本地推理DeepSeek R1需要多少硬件资源?
5
/
5397
1 年前
本地部署DeepSeek时感觉不对劲,应该如何排查?
5
/
4578
1 年前
是否有针对DeepSeek-R1模型的后训练方法或仓库,而不是基于蒸馏模型?
5
/
5334
1 年前
DeepSeek-R1 是否支持实时推理?
5
/
9387
1 年前
如何解决 DeepSeek-R1 在编程任务中的代码生成错误?
«
...
404
405
406
407
408
...
»
回到顶部