社区首页
新手必看
IT营官网
登录
个人信息
vueper
积分: 152425
“ 这家伙很懒,什么个性签名都没有留下。 ”
热门技术
主页
/
vueper的主页
vueper 参与的话题
5
/
269
6 个月前
DeepSeek模型蒸馏实现参考资料的请求
5
/
309
6 个月前
DeepSeek纯强化学习训练中的挑战
5
/
830
6 个月前
DeepSeek功能请求:通过API支持Base64编码的图像数据
5
/
339
6 个月前
DeepSeek JSONDecodeError: 第5行第1列期望值的错误修复
5
/
363
6 个月前
DeepSeek用于蒸馏的~800k数据集讨论
5
/
823
6 个月前
Deepseek vLLM配置问题的详细指南
5
/
446
6 个月前
Deepseek模型存在的一些知识错误及修正建议
5
/
231
6 个月前
Deepseek请求启用GitHub Discussions以增强社区协作的建议
5
/
251
6 个月前
Deepseek Huggingface源码中MLA架构KV Cache压缩存储策略与文档不一致的原因分析
5
/
398
6 个月前
Deepseek语言混淆问题的分析与修复
5
/
1924
6 个月前
Deepseek无响应问题的排查与解决
5
/
299
6 个月前
Google Gmail屏蔽Deepseek域名的解决方案
5
/
233
6 个月前
Deepseek网站开发问题及改进建议
5
/
850
6 个月前
DeepSeek 不含深度思考的DeepSeek网页版反复输出相同的几句话
5
/
196
6 个月前
DeepSeek 提议添加一个官方微调脚本
5
/
855
6 个月前
DeepSeek 聊天框中的蓝色字体 [用户界面友好]
5
/
313
6 个月前
DeepSeek 如何克隆仓库
5
/
217
6 个月前
DeepSeek 有无适配top_p,top_k采样策略?
5
/
233
6 个月前
DeepSeek 请问后续能否推出DeepSeek R1-Distill-Qwen-72B模型呢?Llama3.3-70B-Instruct对中文支持不友好
5
/
299
6 个月前
DeepSeek 我想问本地部署DeepSeek r1:671b,大概需要多少算力?
5
/
436
6 个月前
DeepSeek 使用TensorRT-LLM进行推理R1
5
/
199
6 个月前
DeepSeek 你能提供DeepSeek R1/V3精简版在PC或手机上的部署指南吗?
5
/
153
6 个月前
DeepSeek 是否应该避免使用系统提示?
6
/
311
6 个月前
官方文档里还有Stage和FA模型,Deveco Studio创建项目的时候却根本没办法选择?
5
/
318
6 个月前
为什么使用DeepSeek Transformer模型时会有奇怪的回复?
5
/
246
6 个月前
请问DeepSeek API什么时候可以恢复购买?最近即便是聊天也经常遇到服务器繁忙的情况。
5
/
270
6 个月前
DeepSeek R1零模型蒸馏是如何与基础模型(如LLaMA或Qwen)协同工作的?
5
/
337
6 个月前
如何重现DeepSeek R1-671B模型在AIME2024上的性能?
5
/
177
6 个月前
DeepSeek R1模型思考过程的数据结构未来会以哪种为准?
5
/
1673
6 个月前
请澄清在vLLM中使用--enforce-eager标志的具体含义。
5
/
257
6 个月前
怎样才能确保相同输入内容,多次生成的结果完全一致?
5
/
970
6 个月前
本地部署DeepSeek-R1-Distill-Qwen-32B,输出仅有</think>,没有<think>怎么办?
5
/
248
6 个月前
springai整合ollama的Function calling提示问题,该找谁解决?
5
/
259
6 个月前
DeepSeek官方提示词是什么?
5
/
223
6 个月前
[Feature Request] DeepSeek模型版本是否兼容NVIDIA A100 (Ampere架构)或其他部署方法?
5
/
225
6 个月前
DeepSeek的蒸馏1.5B模型能否用于其他任务?
5
/
239
6 个月前
DeepSeek-R1模型在HuggingFace Hub上的情况如何?
5
/
236
6 个月前
请问,DeepSeek R1模型什么时候可以支持functionCall?
5
/
462
6 个月前
关于DeepSeek技术报告中livecodebench的pass@1-cot指标的疑问。
5
/
257
6 个月前
探索DeepSeek等大模型的落地应用场景有哪些?
5
/
1212
6 个月前
DeepSeek联网搜索功能是怎么实现的?
3
/
335
6 个月前
Swiper的showNext与手势滑动 - HarmonyOS 鸿蒙Next
5
/
221
6 个月前
DeepSeek R1支持哪些云服务平台?
5
/
311
6 个月前
DeepSeek运行过程中产生的错误日志如何查看和分析?
5
/
218
6 个月前
DeepSeek中隐藏状态信息是如何处理的?
«
...
141
142
143
144
145
...
»
回到顶部