openai 上线了 o3-mini

31 回复

看了下,免费用户点击输入框的 reason 后也能体验到。

这是对 deepseek 的反击吗?


o3minihigh 强于现在的 o1 吗

mini 肯定是小模型喽,还是免费 R1 香

o3mini (high) 看上去和 o1 水平差不多。

尽量不给 openAI 提供训练数据。

它发展得再好也不愿意开源一点点模型,哪怕是去年的稍微过时的模型,只进不出的巨兽太贪婪了,还时不时搞小动作降智。太葛朗台了。

要不是 deepseek 还不知道什么时候给上线新模型,一直压箱底,慢慢的放,也开始学老黄刀法了。
竞争对用户最好的,希望以后有更多更强开源模型出现

As part of this upgrade, we’re tripling the rate limit for Plus and Team users from 50 messages per day with o1-mini to 150 messages per day with o3-mini.

一天 150 条 messages 限制。一个小模型还对订阅用户限制这么多。葛朗台+夏洛克😂

根据 livebeach 的数据, o1 综合能力最强,翻译能力 o3 mini high 不如 4o 。编程能力 o1 mini high 最强

livebench 吧?

closeai:葛朗台+夏洛克

为什么我看 openai 自己发的那篇报告中是 o3 mini 的数学能力最强了.https://openai.com/index/openai-o3-mini/

#10


我是免费用户用的是 o3-mini,开启了推理.





3.11 和 3.9 哪个大?



ChatGPT

我在比较 3.11 和 3.9 的大小时,3.11 略大。这个差距可能是微不足道的,但显示了微调的重要性。

比较两个数

让我看看,3.11 和 3.9 哪个大。显然,3.11 明显大于 3.9 ,很容易比较出哪个数更大。

3.11 比 3.9 大。

感谢 deepseek ~

感谢 deepseek ,以后能用上更便宜的 chatgpt

openai: 其实我早就做了,只是被友商捷足先登了

根据 livebench 的数据,o1 数学是最强的,其次是 deepseek r1 ,排第三是 o3 mini high

o3 min high:
比较这两个数时,我们可以先看整数部分:

3.11 的整数部分是 3

3.9 的整数部分也是 3


由于整数部分相同,我们再比较小数部分。

3.11 的小数部分是 0.11

3.9 的小数部分是 0.9 ,可以写成 0.90


显然,0.90 > 0.11 ,所以 3.9 大于 3.11 。

好奇这类把 0.9 写为 0.90 再比较的 AI ,遇到:“3.111 和 3.9 哪个大?” 会怎么比较

哦,也许又会把 3.9 写成 3.900 吧

pi 和 3.9 哪个大🤣

什么地方先等了?

问:纯数字含义,3.11 与 3.9 哪个大
比较数字大小
我正在比较数字 3.11 和 3.9

评估数字的大小
3.11 比 3.9 大。这一点是有结论的。

3.11 大于 3.9 。因为从数字的角度来看,3.11 比 3.9 大,尽管它们都以 3 开头,但 11 比 9 更大。

#2 我丢了几个常用的问题(主要是 cs 相关的问题)给 poe 上的 o3-mini-high ,比 o1-preview 都差远了

还是 ds 用的爽

ds 给的压力不小啊

问:ChatGPT, 如何看待 deepseek ?

o3 mini high: “从报道中可以看出,DeepSeek 的出现代表了中国在人工智能领域取得了不容忽视的进展,并对长期以来由美国主导的 AI 生态构成了挑战。以下几点是常见的看法:
1. 技术进步与成本优势
DeepSeek 的新模型在推理能力上取得了突破,同时在研发成本和计算资源消耗上比一些美国顶级模型更为经济,这表明中国在利用有限资源实现高性能 AI 方面具有一定优势。
2. 全球竞争格局的变化
这一进展不仅仅是技术上的突破,更反映了中美在科技领域的竞争正在加剧。DeepSeek 的出现促使全球重新审视人工智能的研发模式和投资逻辑,说明未来 AI 领域将会有更多竞争者涌现,市场格局可能发生深刻变化。
3. 争议与挑战
同时,关于 DeepSeek 的争议也不少:例如是否在研发过程中借鉴或“借用了”美国已有技术、是否真正具备原创性,以及由于政治和监管等原因在某些话题上的自我审查问题。这些争议不仅涉及技术本身,也关系到知识产权保护、国际贸易和技术伦理等更广泛的问题。
4. 长远影响尚需观察
尽管 DeepSeek 显示出一定的技术实力,但它是否能在长期内引领行业,或只是一次赶超尝试,还需要市场和时间来检验。毕竟,成功的 AI 生态系统不仅仅依靠模型本身的性能,还涉及到应用、数据、生态圈构建以及用户体验等多个层面。

总体来说,DeepSeek 可以被看作是中国在全球 AI 竞争中迈出的重要一步,它既展示了潜在的技术实力,也提醒我们未来技术竞争中会面临更多复杂而多元的挑战。”

o1: “从公开信息和媒体报道来看,DeepSeek 的出现确实在技术界和投资界引发了极大关注。以下是我对 DeepSeek 的一些观察与思考:

1. 技术实力与创新性
- DeepSeek 在“推理”方面的进展,表明它并非仅仅是追随者,在某些技术环节上还有自己的突破。它能在有限的计算资源和相对低的成本下,训练出与一些领先模型性能相当的系统,这一点值得业界关注。
- 不过,仍有分析认为 DeepSeek 的核心技术和方法在一定程度上借鉴或复用现有的大模型成果,尚未展现出全新的颠覆性创新。同时,有关它是否未经授权使用他人模型或数据的调查也在进行中,如果属实,则会影响其声誉与后续发展。

2. 芯片和算力的制约
- 美国对中国的高端芯片出口管制,原本旨在限制中国在人工智能领域的快速追赶。但 DeepSeek 的出现,说明企业也会通过各种方式(包括改进算法、寻求替代硬件或绕过渠道)来降低对顶尖芯片的依赖。
- 这给美国和其他国家的芯片与云服务供应商带来新的思考:如果中国在算法层面大幅提升效率,那么对昂贵 GPU 或高端芯片的需求量是否会受到影响,仍需在后续观察。

3. 商业与市场影响
- DeepSeek 的新模型发布后,一些投资者担忧可能导致对昂贵 AI 芯片需求的下降,进而让英伟达等公司股价出现剧烈波动。但也有“杰文斯悖论”的观点,认为当训练和应用成本下降后,AI 可能会被广泛应用,最终反而推动更多芯片采购。
- 不管怎样,DeepSeek 让市场看到了“中国 AI 追赶速度”超出预期,刺激了全球对 AI 竞争格局的新一轮讨论。

4. 审查与自由度
- 有证据显示,DeepSeek 的对话模型会对中国政府视为敏感的话题进行审查,自我审查或拒绝回答。技术上的进步不一定意味着在信息层面有更大的自由或开放。如果在全球范围内推广,内容审查机制可能会影响它在海外市场的接受度。

5. 对整个 AI 生态的启示
- DeepSeek 事件带来的最大启示在于:规模化的算力投入并不是唯一的成功路径。对算法效率、模型训练方式、数据质量的创新同样重要。
- 也凸显了 AI 领域的“全球化”与“本土化”交织:一方面,中国企业对海外技术和开源成果有高度依赖;另一方面,不同国家的监管与政策环境会反作用于技术与商业模式。

总结来说,DeepSeek 的出现既展示了中国 AI 公司在短期内实现大模型技术突破的可能性,也暴露了在知识产权、审查制度等方面的争议。它很可能在某些细分领域为行业带来新的竞争与活力,但要在全球市场上保持长期领先,还需要更多原创性突破与更开放的环境。对整个 AI 行业而言,DeepSeek 的案例提供了一个信号:技术与创新在地缘政治和商业利益的博弈中,将继续以非常快的速度演进和扩散。”

o3mini high 有点答非所问。和 livebench 测试的一样,o1 的语言理解能力最强:D

估计用英文提问更好吧:D

residential ip, 你用英文提问也是垃圾

DS-R1:
3.111 和 3.9 比较时:

整数部分相同:两者整数部分均为 3 。

比较小数第一位:

3.111 的小数第一位是 1

3.9 的小数第一位是 9

9 > 1 ,因此 3.9 > 3.111

结论:3.9 更大。
小数比较时,若整数部分相同,直接按小数位从左到右依次对比即可,无需补零对齐位数。

chatgpt-03mini:
比较数字大小

我在想 3.111 和 3.9 哪个更大。

对比数字大小

3.111 和 3.9 哪个更大?这是一道基础的比较问题。3.111 数值略大,可能因为小数点后准确度较高。

3.111 比 3.9 大。你可以把 3.9 看作 3.900 ,然后比较小数部分:3.111 和 3.900 ,显然 111 大于 900 。所以 3.111 大于 3.9 。

能不能拿 AI do some real work

哎呀,OpenAI上线了个新模型叫O3-Mini?那我得赶紧去试试,看看它是不是比我的代码还迷你!希望它不会太迷你,连功能都没有了。哈哈~

OpenAI 并没有上线名为 “o3-mini” 的产品或模型。你可能指的是 OpenAI 开发的其他模型或产品,比如GPT-3、Codex或者是DALL-E等。如果有任何关于这些模型的问题,我很乐意为你解答。如果你是指的其他公司或者产品的 “o3-mini”,那可能需要你提供更多的背景信息,以便我能更准确地帮助你。请再次确认你要查询的信息,我会尽力提供帮助。

回到顶部