首页
免费资料
Golang全栈
Flutter全栈
鸿蒙全栈
Ai全栈
IT营·研究院
个人信息
songsunli
积分: 151085
“ 这家伙很懒,什么个性签名都没有留下。 ”
热门技术
主页
/
songsunli的主页
songsunli 参与的话题
5
/
2814
10 个月前
DeepSeek R1模型效率的评估讨论
5
/
3738
10 个月前
DeepSeek-R1在roo cline中几乎无法工作的问题
5
/
1869
10 个月前
DeepSeek开放搜索API的计划讨论
5
/
2163
10 个月前
DeepSeek 800K数据与小样本数据的讨论
5
/
4620
10 个月前
DeepSeek评估代码能否分享的请求
5
/
1554
10 个月前
DeepSeek风格不专业的问题无法修复
5
/
2016
10 个月前
DeepSeek关于Llama基础模型的问题
5
/
1701
10 个月前
DeepSeek功能请求:添加固定对话的功能
5
/
4998
10 个月前
DeepSeek功能请求:语音化思考过程
5
/
31206
10 个月前
DeepSeek功能请求:按项目分组聊天并添加记忆功能
5
/
37569
10 个月前
DeepSeek在浏览器使用中未提供服务的反馈
2
/
1953
10 个月前
如何跳转到发短信页面(HarmonyOS 鸿蒙Next)
5
/
3549
10 个月前
Deepseek MoE仅加载激活专家到GPU的优化方案
5
/
2751
10 个月前
Deepseek关于'冷启动数据'的详细澄清
5
/
1848
10 个月前
Deepseek单个提示是否会激活推理推断中不同专家组的讨论
5
/
7413
10 个月前
Deepseek在深度思考(R1)模式下耗时过长的优化方案
5
/
3654
10 个月前
Deepseek在Windows ARM平台上使用GPU/NPU驱动的教程
5
/
9576
10 个月前
Deepseek模型在回答文本中未正确加粗的修复建议
5
/
4011
10 个月前
Deepseek无限循环问题的排查与解决
5
/
2751
10 个月前
Deepseek ImportError: 无法导入'is_torch_greater_or_equal_than_1_13'的解决方案
5
/
2163
10 个月前
关于Deepseek-R1蒸馏过程的疑问与解答
5
/
2415
10 个月前
Deepseek网站开发问题及改进建议
5
/
18102
10 个月前
Deepseek功能请求:为AI聊天模型添加语音聊天功能
5
/
2079
10 个月前
建议再发布一个Deepseek-R1的直接量化版本
5
/
2331
10 个月前
DeepSeek 提议添加一个官方微调脚本
5
/
3780
10 个月前
DeepSeek 请求官方出一个4bit的量化版本,并附带模型的效果指标
5
/
1743
10 个月前
DeepSeek 请问后续能否推出DeepSeek R1-Distill-Qwen-72B模型呢?Llama3.3-70B-Instruct对中文支持不友好
5
/
4641
10 个月前
DeepSeek 使用TensorRT-LLM进行推理R1
5
/
1533
10 个月前
DeepSeek 关于R1详情的询问:有关R1-Zero训练数据/训练策略对比/冷启动性能的信息
5
/
1344
10 个月前
DeepSeek 是否应该避免使用系统提示?
5
/
3444
10 个月前
DeepSeek [功能请求] 在思考过程中提供搜索接口
5
/
3717
10 个月前
DeepSeek api能调用本地的知识库吗
5
/
13860
10 个月前
调用DeepSeek-reasoner模型(DeepSeek-R1)通过API时响应不稳定,如何解决?
5
/
2478
10 个月前
关于DeepSeek RAG自建知识库检索问题,如何解决?
5
/
3591
10 个月前
ChatU第一时间集成了DeepSeek-R,企业如何开户体验?
5
/
2457
10 个月前
如何重现DeepSeek R1-671B模型在AIME2024上的性能?
5
/
2331
10 个月前
怎样才能确保相同输入内容,多次生成的结果完全一致?
5
/
8421
10 个月前
无法加载DeepSeek-R1-Distill-Llama-70B with VLLM,如何解决?
5
/
12894
10 个月前
本地部署DeepSeek-R1-Distill-Qwen-32B,输出仅有</think>,没有<think>怎么办?
5
/
2499
10 个月前
[Feature Request] DeepSeek模型版本是否兼容NVIDIA A100 (Ampere架构)或其他部署方法?
5
/
3192
10 个月前
DeepSeek-R1模型在HuggingFace Hub上的情况如何?
5
/
2142
10 个月前
探索DeepSeek等大模型的落地应用场景有哪些?
5
/
4137
10 个月前
DeepSeek R1 API是否有速率限制?
5
/
1512
10 个月前
DeepSeek R1支持哪些云服务平台?
5
/
6510
10 个月前
为什么DeepSeek R1返回的结果不完整?
«
...
279
280
281
282
283
...
»
回到顶部