首页
免费资料
Golang全栈
Flutter全栈
鸿蒙全栈
Ai全栈
IT营·研究院
个人信息
vueper
积分: 149890
“ 这家伙很懒,什么个性签名都没有留下。 ”
热门技术
主页
/
vueper的主页
vueper 参与的话题
5
/
1659
9 个月前
DeepSeek请求发布用于蒸馏的SFT数据集
5
/
2814
9 个月前
DeepSeek关于格式奖励模型的更多讨论
5
/
3192
9 个月前
DeepSeek-Reasoner不支持连续的用户或助手消息的问题
5
/
31920
9 个月前
DeepSeek在ollama上运行时如何避免返回<think>标签的解决方案
5
/
2604
9 个月前
DeepSeek R1模型效率的评估讨论
5
/
1449
9 个月前
DeepSeek如下文问题的讨论
5
/
2142
9 个月前
DeepSeek评估代码的请求
5
/
1953
9 个月前
DeepSeek-R1用于增强网页自动化的浏览器使用讨论
5
/
5502
9 个月前
DeepSeek功能请求:实现会话记忆/持久化上下文
5
/
1764
9 个月前
DeepSeek模型蒸馏实现参考资料的请求
5
/
1995
9 个月前
DeepSeek纯强化学习训练中的挑战
5
/
5901
9 个月前
DeepSeek功能请求:通过API支持Base64编码的图像数据
5
/
3801
9 个月前
DeepSeek JSONDecodeError: 第5行第1列期望值的错误修复
5
/
2247
9 个月前
DeepSeek用于蒸馏的~800k数据集讨论
5
/
23772
9 个月前
Deepseek vLLM配置问题的详细指南
5
/
6573
9 个月前
Deepseek模型存在的一些知识错误及修正建议
5
/
1491
9 个月前
Deepseek请求启用GitHub Discussions以增强社区协作的建议
5
/
1890
9 个月前
Deepseek Huggingface源码中MLA架构KV Cache压缩存储策略与文档不一致的原因分析
5
/
6531
9 个月前
Deepseek语言混淆问题的分析与修复
5
/
73647
9 个月前
Deepseek无响应问题的排查与解决
5
/
4200
9 个月前
Google Gmail屏蔽Deepseek域名的解决方案
5
/
2226
9 个月前
Deepseek网站开发问题及改进建议
5
/
21462
9 个月前
DeepSeek 不含深度思考的DeepSeek网页版反复输出相同的几句话
5
/
2100
9 个月前
DeepSeek 提议添加一个官方微调脚本
5
/
2058
9 个月前
DeepSeek 聊天框中的蓝色字体 [用户界面友好]
5
/
3066
9 个月前
DeepSeek 如何克隆仓库
5
/
2247
9 个月前
DeepSeek 有无适配top_p,top_k采样策略?
5
/
1596
9 个月前
DeepSeek 请问后续能否推出DeepSeek R1-Distill-Qwen-72B模型呢?Llama3.3-70B-Instruct对中文支持不友好
5
/
4536
9 个月前
DeepSeek 我想问本地部署DeepSeek r1:671b,大概需要多少算力?
5
/
4263
9 个月前
DeepSeek 使用TensorRT-LLM进行推理R1
5
/
2058
9 个月前
DeepSeek 你能提供DeepSeek R1/V3精简版在PC或手机上的部署指南吗?
5
/
1239
9 个月前
DeepSeek 是否应该避免使用系统提示?
6
/
3255
9 个月前
官方文档里还有Stage和FA模型,Deveco Studio创建项目的时候却根本没办法选择?
5
/
4662
9 个月前
为什么使用DeepSeek Transformer模型时会有奇怪的回复?
5
/
1491
9 个月前
请问DeepSeek API什么时候可以恢复购买?最近即便是聊天也经常遇到服务器繁忙的情况。
5
/
3612
9 个月前
DeepSeek R1零模型蒸馏是如何与基础模型(如LLaMA或Qwen)协同工作的?
5
/
2331
9 个月前
如何重现DeepSeek R1-671B模型在AIME2024上的性能?
5
/
1449
9 个月前
DeepSeek R1模型思考过程的数据结构未来会以哪种为准?
5
/
27930
9 个月前
请澄清在vLLM中使用--enforce-eager标志的具体含义。
5
/
2205
9 个月前
怎样才能确保相同输入内容,多次生成的结果完全一致?
5
/
12579
9 个月前
本地部署DeepSeek-R1-Distill-Qwen-32B,输出仅有</think>,没有<think>怎么办?
5
/
3612
9 个月前
springai整合ollama的Function calling提示问题,该找谁解决?
5
/
2520
9 个月前
DeepSeek官方提示词是什么?
5
/
2436
9 个月前
[Feature Request] DeepSeek模型版本是否兼容NVIDIA A100 (Ampere架构)或其他部署方法?
5
/
2142
9 个月前
DeepSeek的蒸馏1.5B模型能否用于其他任务?
«
...
273
274
275
276
277
...
»
回到顶部