site:www.51cto.com - Search News

OpenAI要“动手”了，它计划对自己的模型产品阵容来一场大“瘦身”!就在它准备推出最后一个非推理模型GPT-4.5之际，这家科技巨头罕见地承认，之前的产品发布在客户眼里竟然没啥区别，这让市场有点懵。

2月13日，CEO Sam Altman表示，OpenAI计划将其Orion大语言模型作为GPT-4.5发布——这是一个传统的、非推理模型。之后，则会把GPT模型和o系列推理模型合并为一个单一的AI。

每年我们都期待从我们全球11万名会员中选出新一届的ACM杰出会员。ACM的口号是「推进计算机科学和专业的发展」。为实现我们的使命，我们完全依赖志愿者们的工作——从组织技术会议到编辑研究期刊和管理专业发展活动。

研究人员采用零样本思维链（zero-shot chain-of-thought）的方法，对18种不同类型的LLM进行了全面测试。这些模型涵盖了长思维链模型、闭源大模型、开源小模型以及数学专用模型等。

DeepSeek-R1 花了10分钟思考差点就成功了。它认为隐藏的信息可能是Onli!n37e27i4h4he3ingle7odlol。因为觉得如果只是一个单词“lol”，那就是无稽之谈，所以就放弃了。

就在刚刚，来自斯坦福、UC伯克利、华盛顿大学等机构联手发布了一款SOTA级推理模型——OpenThinker-32B，并同时开源了高达114k的训练数据。

研究人员首先关注左右手按键引起的诱发反应差异，结果显示，脑磁图（MEG）在手分类的准确率上优于脑电图（EEG）。MEG的峰值准确率为74%（±1.3%标准误差均值），而EEG的峰值准确率为64%（±0.8%）。

迈克选择的路线叫“普雷斯探险步道”，它得名于1890年在一家报社的赞助下探索该地区的探险队。那次探险之旅历经磨难，当时，队员们的食物消耗殆尽身上的衣服也都磨烂了。

现任首席科学家 Jeff Dean 、出走又回归的Transformer作者 Noam Shazeer ，与知名播客主持人Dwarkesh Patel展开对谈。

尽管最顶尖的人类参赛者仍然远远强于o3，他们的解题率超过85%，但评分和解题率都表明，o3可以位列全球前200名活跃参与者之中。

基于互联网上的常见设计，写一段HTML代码创建一个创意的爱心告白小程序，结合现代流行的交互效果。要求加入动态特效，如点击爱心时弹出告白语句，同时要参考当前网络趋势中流行的设计风格。代码要简洁、易于实现，并尽量引入一些现代化的网页设计元素，如CSS动画 ...

为了提高性能，新技术使用了多代理辩论（Multiagent Debate）的概念，即：由多个 LLM ...

Some results have been hidden because they may be inaccessible to you