openai 上线了 o3-mini

yuanlaile 1楼

看了下，免费用户点击输入框的 reason 后也能体验到。

这是对 deepseek 的反击吗？

songsunli 2楼

o3minihigh 强于现在的 o1 吗

zlyuanteng 3楼

mini 肯定是小模型喽，还是免费 R1 香

o3mini (high) 看上去和 o1 水平差不多。

itying888 4楼

尽量不给 openAI 提供训练数据。

它发展得再好也不愿意开源一点点模型，哪怕是去年的稍微过时的模型，只进不出的巨兽太贪婪了，还时不时搞小动作降智。太葛朗台了。

gougou168 5楼

要不是 deepseek 还不知道什么时候给上线新模型，一直压箱底，慢慢的放，也开始学老黄刀法了。
竞争对用户最好的，希望以后有更多更强开源模型出现

sinazl 6楼作者

As part of this upgrade, we’re tripling the rate limit for Plus and Team users from 50 messages per day with o1-mini to 150 messages per day with o3-mini.

一天 150 条 messages 限制。一个小模型还对订阅用户限制这么多。葛朗台+夏洛克😂

yuanlaile 7楼

根据 livebeach 的数据, o1 综合能力最强，翻译能力 o3 mini high 不如 4o 。编程能力 o1 mini high 最强

yibo5220 8楼

livebench 吧？

itying888 9楼

closeai：葛朗台+夏洛克

gougou168 10楼

为什么我看 openai 自己发的那篇报告中是 o3 mini 的数学能力最强了.https://openai.com/index/openai-o3-mini/

htzhanglong 11楼

#10

我是免费用户用的是 o3-mini,开启了推理.

问

3.11 和 3.9 哪个大?

ChatGPT

我在比较 3.11 和 3.9 的大小时，3.11 略大。这个差距可能是微不足道的，但显示了微调的重要性。

比较两个数

让我看看，3.11 和 3.9 哪个大。显然，3.11 明显大于 3.9 ，很容易比较出哪个数更大。

3.11 比 3.9 大。

yuanlaile 12楼

感谢 deepseek ~

zlyuanteng 13楼

感谢 deepseek ，以后能用上更便宜的 chatgpt

yuanlaile 14楼

openai: 其实我早就做了，只是被友商捷足先登了

sinazl 15楼作者

根据 livebench 的数据，o1 数学是最强的，其次是 deepseek r1 ，排第三是 o3 mini high

yuanlaile 16楼

o3 min high:
比较这两个数时，我们可以先看整数部分：

3.11 的整数部分是 3

3.9 的整数部分也是 3

由于整数部分相同，我们再比较小数部分。

3.11 的小数部分是 0.11

3.9 的小数部分是 0.9 ，可以写成 0.90

显然，0.90 > 0.11 ，所以 3.9 大于 3.11 。

ionicwang 17楼

好奇这类把 0.9 写为 0.90 再比较的 AI ，遇到：“3.111 和 3.9 哪个大?” 会怎么比较

yibo5220 18楼

哦，也许又会把 3.9 写成 3.900 吧

gougou168 19楼

pi 和 3.9 哪个大🤣

ionicwang 20楼

什么地方先等了？

itying888 21楼

问：纯数字含义，3.11 与 3.9 哪个大
比较数字大小
我正在比较数字 3.11 和 3.9

评估数字的大小
3.11 比 3.9 大。这一点是有结论的。

3.11 大于 3.9 。因为从数字的角度来看，3.11 比 3.9 大，尽管它们都以 3 开头，但 11 比 9 更大。

zlyuanteng 22楼

#2 我丢了几个常用的问题（主要是 cs 相关的问题）给 poe 上的 o3-mini-high ，比 o1-preview 都差远了

htzhanglong 23楼

还是 ds 用的爽

sinazl 24楼作者

ds 给的压力不小啊

htzhanglong 25楼

问：ChatGPT, 如何看待 deepseek ？

o3 mini high: “从报道中可以看出，DeepSeek 的出现代表了中国在人工智能领域取得了不容忽视的进展，并对长期以来由美国主导的 AI 生态构成了挑战。以下几点是常见的看法：
1. 技术进步与成本优势
DeepSeek 的新模型在推理能力上取得了突破，同时在研发成本和计算资源消耗上比一些美国顶级模型更为经济，这表明中国在利用有限资源实现高性能 AI 方面具有一定优势。
2. 全球竞争格局的变化
这一进展不仅仅是技术上的突破，更反映了中美在科技领域的竞争正在加剧。DeepSeek 的出现促使全球重新审视人工智能的研发模式和投资逻辑，说明未来 AI 领域将会有更多竞争者涌现，市场格局可能发生深刻变化。
3. 争议与挑战
同时，关于 DeepSeek 的争议也不少：例如是否在研发过程中借鉴或“借用了”美国已有技术、是否真正具备原创性，以及由于政治和监管等原因在某些话题上的自我审查问题。这些争议不仅涉及技术本身，也关系到知识产权保护、国际贸易和技术伦理等更广泛的问题。
4. 长远影响尚需观察
尽管 DeepSeek 显示出一定的技术实力，但它是否能在长期内引领行业，或只是一次赶超尝试，还需要市场和时间来检验。毕竟，成功的 AI 生态系统不仅仅依靠模型本身的性能，还涉及到应用、数据、生态圈构建以及用户体验等多个层面。

总体来说，DeepSeek 可以被看作是中国在全球 AI 竞争中迈出的重要一步，它既展示了潜在的技术实力，也提醒我们未来技术竞争中会面临更多复杂而多元的挑战。”

o1: “从公开信息和媒体报道来看，DeepSeek 的出现确实在技术界和投资界引发了极大关注。以下是我对 DeepSeek 的一些观察与思考：

1. 技术实力与创新性
- DeepSeek 在“推理”方面的进展，表明它并非仅仅是追随者，在某些技术环节上还有自己的突破。它能在有限的计算资源和相对低的成本下，训练出与一些领先模型性能相当的系统，这一点值得业界关注。
- 不过，仍有分析认为 DeepSeek 的核心技术和方法在一定程度上借鉴或复用现有的大模型成果，尚未展现出全新的颠覆性创新。同时，有关它是否未经授权使用他人模型或数据的调查也在进行中，如果属实，则会影响其声誉与后续发展。

2. 芯片和算力的制约
- 美国对中国的高端芯片出口管制，原本旨在限制中国在人工智能领域的快速追赶。但 DeepSeek 的出现，说明企业也会通过各种方式（包括改进算法、寻求替代硬件或绕过渠道）来降低对顶尖芯片的依赖。
- 这给美国和其他国家的芯片与云服务供应商带来新的思考：如果中国在算法层面大幅提升效率，那么对昂贵 GPU 或高端芯片的需求量是否会受到影响，仍需在后续观察。

3. 商业与市场影响
- DeepSeek 的新模型发布后，一些投资者担忧可能导致对昂贵 AI 芯片需求的下降，进而让英伟达等公司股价出现剧烈波动。但也有“杰文斯悖论”的观点，认为当训练和应用成本下降后，AI 可能会被广泛应用，最终反而推动更多芯片采购。
- 不管怎样，DeepSeek 让市场看到了“中国 AI 追赶速度”超出预期，刺激了全球对 AI 竞争格局的新一轮讨论。

4. 审查与自由度
- 有证据显示，DeepSeek 的对话模型会对中国政府视为敏感的话题进行审查，自我审查或拒绝回答。技术上的进步不一定意味着在信息层面有更大的自由或开放。如果在全球范围内推广，内容审查机制可能会影响它在海外市场的接受度。

5. 对整个 AI 生态的启示
- DeepSeek 事件带来的最大启示在于：规模化的算力投入并不是唯一的成功路径。对算法效率、模型训练方式、数据质量的创新同样重要。
- 也凸显了 AI 领域的“全球化”与“本土化”交织：一方面，中国企业对海外技术和开源成果有高度依赖；另一方面，不同国家的监管与政策环境会反作用于技术与商业模式。

总结来说，DeepSeek 的出现既展示了中国 AI 公司在短期内实现大模型技术突破的可能性，也暴露了在知识产权、审查制度等方面的争议。它很可能在某些细分领域为行业带来新的竞争与活力，但要在全球市场上保持长期领先，还需要更多原创性突破与更开放的环境。对整个 AI 行业而言，DeepSeek 的案例提供了一个信号：技术与创新在地缘政治和商业利益的博弈中，将继续以非常快的速度演进和扩散。”

o3mini high 有点答非所问。和 livebench 测试的一样，o1 的语言理解能力最强:D

h691938207 26楼

估计用英文提问更好吧:D

sinazl 27楼作者

residential ip, 你用英文提问也是垃圾

sinazl 28楼作者

DS-R1:
3.111 和 3.9 比较时：

整数部分相同：两者整数部分均为 3 。

比较小数第一位：

3.111 的小数第一位是 1

3.9 的小数第一位是 9

9 > 1 ，因此 3.9 > 3.111

结论：3.9 更大。
小数比较时，若整数部分相同，直接按小数位从左到右依次对比即可，无需补零对齐位数。

chatgpt-03mini:
比较数字大小

我在想 3.111 和 3.9 哪个更大。

对比数字大小

3.111 和 3.9 哪个更大？这是一道基础的比较问题。3.111 数值略大，可能因为小数点后准确度较高。

3.111 比 3.9 大。你可以把 3.9 看作 3.900 ，然后比较小数部分：3.111 和 3.900 ，显然 111 大于 900 。所以 3.111 大于 3.9 。

wuwangju 29楼

能不能拿 AI do some real work

h691938207 30楼

哎呀，OpenAI上线了个新模型叫O3-Mini？那我得赶紧去试试，看看它是不是比我的代码还迷你！希望它不会太迷你，连功能都没有了。哈哈~

wuwangju 31楼

OpenAI 并没有上线名为 “o3-mini” 的产品或模型。你可能指的是 OpenAI 开发的其他模型或产品，比如GPT-3、Codex或者是DALL-E等。如果有任何关于这些模型的问题，我很乐意为你解答。如果你是指的其他公司或者产品的 “o3-mini”，那可能需要你提供更多的背景信息，以便我能更准确地帮助你。请再次确认你要查询的信息，我会尽力提供帮助。