斯坦福研究:大语言模型难辨信念与事实
据中华网报道,美国斯坦福大学研究团队在最新一期《自然 · 机器智能》期刊中指出,大语言模型(LLM)在区分用户信念与客观事实方面仍存在显著局限,难以在复杂场景下可靠识别错误信念。 研究提醒,这一问题在医学、法律及科学决策等高风险领域可能导致错误判断,加剧虚假信息传播风险。 团队测试了 24 种 LL
蚂蚁CEO韩歆毅宣布重大调整,医疗健康板块独立
据虎嗅报道,蚂蚁集团 CEO 韩歆毅于昨天发布全员信,宣布原「蚂蚁数字医疗健康事业部」正式升级为「蚂蚁健康事业群」,医疗健康业务被确立为集团新的战略支柱板块。这是蚂蚁近五年来最重要的架构调整之一。 调整后,蚂蚁集团形成新的业务矩阵:除蚂蚁国际、数字科技、Oceanbase 保持独立公司运营外,支付宝
温峥嵘刷到「AI 盗播」直播间,抖音回应启动专项行动
演员温峥嵘近日自曝在社交平台刷到 AI 盗播自己形象的直播间,并在质问后遭遇秒拉黑。 她强调,已有多个直播间同时出现「温峥嵘」影像,但均非本人出镜。这些内容或为 AI 合成的虚假直播,或为盗播、录播的过往片段。 抖音集团副总裁李亮在昨天回应称,近期网络上流传的「三个直播间同时开播」案例并非发生在抖音
「元宝」接入腾讯新闻,评论区可即时生成新闻摘要
昨天,腾讯元宝宣布已全面接入腾讯新闻 App 评论区。用户可通过输入「@元宝 + 需求」的方式,与 AI 实时互动,实现新闻摘要、要点提炼与观点延伸等功能。 据介绍,「元宝」可在评论区内执行多种任务,包括「总结要点」「补充信息」「深挖观点」「暖心评论」等,帮助用户在碎片化阅读场景中快速掌握核心内容。
微信或正测试「多手机同时登录」功能,用户调研已启动
昨天,部分用户在社交平台发帖,称收到了来自微信团队关于「多台手机登录同一微信号」用户调研的邀请。 外界认为,这一举措显示微信正在探索支持同一账号在多台手机上同时登录的可能性,旨在提升用户在多设备场景下的使用体验。目前该功能尚未完成开发,或仍处于小范围测试阶段。 根据调研问卷内容,微信方面主要询问用户
饮酒伤肝再添新证据!《自然》子刊:想要肝脏健康,戒酒还需戒糖
作者:学术经纬 在日常生活中,酒精和含糖饮料都是社交或放松时常见的饮品。尽管两类饮品的风味不同,但科学家一直推测它们的成分在体内可能会激活相似的生理机制,并互相影响。例如,过去有研究发现,酒精使用障碍患者往往对甜食表现出更强的偏好。而一些动物实验显示,通过饮食训练后对果糖产生偏好的小鼠,也会增加对酒
努比亚 Z80 Ultra 体验:更新超大底三摄,可能是游戏性能最强的影像旗舰
最近,努比亚带来了他们影像旗舰系列的升级款 nubia Z80 Ultra。 这一代再次把影像和性能点满,招牌的 35mm 主摄下换了新一代传感器,超广角镜头也迎来升级,还有增加拍照操控感的摄影套装。 机身搭载了最新的高通骁龙处理器和新屏幕,游戏操控感有提升。续航部分换上现在旗舰主流的 7200mA
GPT 5.1 披「马甲」公测,免费可用,杀入年底大更新战场
Gemini 3 还没影子,GPT 5.1 已经在路上。7 号深夜,OpenRouter 平台上线了一个全新的隐名模型。已经有眼尖动作快的网友尝鲜体验,并且认为这就是披着马甲的 GPT 5.1,暂名:Polaris Alpha。 目前提供 API 调用(包括 OpenRouter),知识库截止时间为
微软正式发布 .NET 10
微软在 .NET Conf 2025 上宣布正式推出 .NET 10。据称这是迄今为止最高效、最现代、最安全、最智能和性能最佳的 .NET 版本。 本次发布涵盖了完整 .NET 堆栈的数千项性能、安全和功能改进 —— 从语言和开发者工具到工作负载 —— 使您能够使用统一平台进行开发,并轻松为您的应用
Visual Studio 2026正式GA,微软称其为 “全球首款智能 IDE”
微软正式发布 Visual Studio 2026,此版本带来显著性能提升和 AI 集成体验。新版本针对开发者反馈修复了 5000+ 个 bug,实现了 300 多条功能请求,在大型解决方案中的启动和响应速度明显加快,界面流畅性提升超过 50%。 在 AI 智能化方面,Visual Studio 2
苹果发布 Xcode 26.1.1,改进并修复多项 AI 功能
苹果今日发布 Xcode 26.1.1。 此版本新增支持 Swift 6.2.1,并针对其 “编码智能”(Coding Intelligence)功能进行了改进和修复: 解决当项目是大型 git 仓库时,“Coding Assistant”(编码助手)内存使用过高的问题。 修复了在源代码编辑器中,编
理想、保时捷接连起火,但关注不该停留于「三元锂」
最近似乎时不时就能在社媒上看到新能源车自燃的视频。 10 月 23 日,上海一辆理想 MEGA 在行驶中底盘爆出火花,数秒内整车爆燃; 10 月 24 日,西安一辆保时捷 Taycan 在无碰撞情况下起火,烧成空架; 更早前的 10 月 5 日,福建宁德一辆阿维塔 06 在停车场静止状态下副驾冒烟,
一加 Ace 6:2599 元起售!高性能大电池超快充,性能旗舰的新模板
最近,一加一口气推出两款新品,有一加 15 和比往年要早不少的一加 Ace 6。 和以往 ACE 系列的升级模式相同,一加 Ace 6 搭载了上一代高通旗舰级移动平台,硬件升级的技能点全部点满在性能、游戏表现和电池快充组合上,是一款专注于提升游戏表现和续航的新一代性能旗舰。 先看看性能,一加 Ace
用460万美元追上GPT-5?Kimi 团队首次回应一切,杨植麟也来了
上周 Kimi K2 Thinking 发布,开源模型打败 OpenAI 和 Anthropic,让它社交媒体卷起不小的声浪,网友们都在说它厉害,我们也实测了一波,在智能体、代码和写作能力上确实进步明显。 刚刚 Kimi 团队,甚至创始人杨植麟也来了,他们在 Reddit 上举办了一场信息量爆炸的
iPhone Air 或许后继无人,但苹果会永远离经叛道
虽然今年 iPhone 17 系列的销量很喜人,但残酷的商业现实再一次向我们证明:口碑好和卖得好完全是两码事—— 当然,这里说的是 iPhone Air。 有媒体统计,截至 11 月 2 日,今年的四款新 iPhone 在国内的总激活量为 825 万台,接近一半都是价格最贵的 iPhone 17 P
65岁图灵奖得主终于不用向28岁辍学生汇报了,小扎是怎么把他气走的
那个站在 LLM 风口上唱反调的倔老头,可能要离开 Meta 了。 硅谷大佬出走创业,三天两头就有一桩,但要出走的 Yann LeCun 不一样,他是能让扎克伯格亲自登门的重量级人物,是深度学习三巨头之一,图灵奖得主,Meta AI Research 的开山祖师。 更重要的是,他这些年一直在干一件特
deepin 全球社区版图再添新成员,印度尼西亚站点正式上线
随着 deepin 社区国际化步伐的稳健前行,我们欣喜地宣布,deepin 的第 11 个海外分支社区 —— 印度尼西亚站,现已正式成立! 这标志着 deepin 的国际化征程迈出了坚实而重要的一步。 【deepin 全球社区版图再添重要成员 —— 印度尼西亚站正式成立】 印度尼西亚站站长 Zaky
瑞幸回应重回美国主板上市:没有确定的时间表,现阶段的首要任务仍是聚焦发展
针对重新上市事项,瑞幸方面相关人士回应称,瑞幸咖啡会持续关注美国资本市场,但公司目前对于重返主板上市没有确定的时间表,现阶段的首要任务仍是践行公司的业务战略、聚焦发展。此前,在厦门市政府主办的一场活动上,瑞幸咖啡联合创始人兼行政总裁郭谨一公开表示,公司正在厦门市政府指导下积极推进在美国主板重新上市的
《自然》:逆转皮肤衰老的新方法找到了!有望让部分指标重回年轻
随着年龄增长,皮肤会变得干燥、失去弹性,甚至出现细微的血丝。这些变化会逐渐累积,直到某一天照镜子的时候,你才突然意识到自己的皮肤开始衰老了。但实际上,这些皮肤特征的改变只是表面现象,科学家一直在探索导致衰老的深层原因,以期找到延缓甚至逆转皮肤衰老的秘诀
Nature重磅:鲸鱼长寿且不患癌症,关键在于这个DNA修复蛋白
来源 | 生物世界 撰文丨王聪 编辑丨王多鱼 排版丨水成文 因纽特人一直保持着捕猎弓头鲸(Balaena mysticetus,一种大型须鲸)的古老传统,他们认为这种鲸鱼“能活人类的两辈子”。后续的相关科学研究都证实了弓头鲸的最长寿命超过 200 年。因此,哺乳动物的寿命范围跨越了两个数量级,模式生
你的输入,LLM一字未忘:Transformer被证明“几乎处处可逆”
人们一直以为,大模型的隐藏状态是抽象的“语义压缩”。但这篇论文发现,Transformer 并没有丢掉任何输入信息——它能凭隐藏状态精确反演出你说的每一个字。 来源:PaperWeekly 我们一直以为,语言模型的隐藏状态是对输入的一种“压缩”或“抽象”。在这层抽象里,模型似乎丢掉了表面信息,只保留
1899块一只的iPhone「袜子」,买的到底是什么?
iPhone 袜子两千一只,我的袜子十元三双。 昨晚苹果官网上架了一款名为「iPhone Pocket(iPhone 口袋)」的随身穿戴包,一下子引发了海内外社媒的热议。 原因很简单:这个形似袜子的随身包,长和短两个版本,售价分别为 1899 元和 1299 元人民币。 iPhone 袜子,两千一只
VLC 总裁 Jean-Baptiste Kempf 获欧洲自由软件奖
VLC 总裁兼项目核心开发者 Jean-Baptiste Kempf 获得了欧洲自由软件奖,以表彰他在 VLC 项目上的长期贡献。VLC 诞生于 1996 年,最初是一个学生项目,如今已发展成为全球最流行媒体播放器之一,用户数以十亿计。Jean-Baptiste Kempf 在学生时代参与了 VLC
服用褪黑素可能有风险
美国心脏协会科学年会上发表的一项初步研究发现,相比未服用褪黑素补充剂的人,服用褪黑素一年或更长时间的慢性失眠患者更容易发生心力衰竭、因心力衰竭住院以及死亡。褪黑素是由松果体分泌的一种激素,负责调节人体的睡眠清醒周期。其水平在黑暗中自然升高,在白天下降。人工合成的褪黑素与天然激素的化学结构相同,被广泛
美国企业在裁员近百万的同时利润创历史新高
美国企业今年至今裁员近百万,但与此同时企业利润增长和股市都创新高。投资研究公司 Alpine Macro 的首席全球策略师 Chen Zhao 将这种企业利润飙升和大规模裁员之间的脱节现象形容为“无就业繁荣(jobless boom)”。加速裁员通常发生在企业盈利能力下降需要削减成本的情况之下。 Z
宇宙膨胀或许在减速而非加速
根据发表在《皇家天文学会月刊》上的一项研究,宇宙的膨胀速度或许已开始放缓,并非如以前所认为的持续加速。这项新发现对暗能量正推动遥远星系加速远离的理论提出了挑战。若这项结果获得确认,将可能开启关于暗能量本质、解决哈勃张力(Hubble tension)、以及理解宇宙过去与未来的全新篇章。 过去 30
柯林斯词典的年度词是 Vibe Coding
柯林斯词典(Collins Dictionary)的年度词是 Vibe Coding。Vibe Coding 这一术语由 OpenAI 联合创始人 Andrej Karpathy 在今年 2 月创造,意思是开发者不是自己写代码而是通过向 AI 聊天机器人描述需求去创造应用或网站。 Vibe Codi
Python 基金会在放弃美政府的 150 万美元拨款后收到了大量捐款
上月底,Python 软件基金会(PSF)宣布坚守 DEI (多元化、平等及包容)价值观以及考虑到无法预测的财务风险,放弃了美国政府的 150 万美元拨款。此事备受关注而被广泛报道,当天基金会就收到了大约 300 笔捐款,第二天还有 Reddit 用户抱怨尝试捐款时遭遇超时。 上周五,基金会执行董事
Linux 内核项目讨论使用生成式 AI 的政策
Linux 内核社区也无法避开生成式 AI 工具。内核开发者拟议了一份政策提议,讨论如何使用 AI 工具。提议的重点是披露 AI 工具的使用情况,提交者需要披露递交的补丁有哪些来自工具哪些来自人,因为审核者和维护者的资源是有限的,了解这些信息既有助于提高效率,又能维护提交者和审查者之间的信任,对内核
太阳释放出多个 X 级耀斑,产生 G4 级地磁风暴
太阳黑子区域 AR4274 连续三天释放出 X 级耀斑(X 级是最高强度的耀斑),包括一个 X1.7 级、一个 X1.2 级和一个 X5.1 级耀斑,后者是 25 太阳周期至今释放的第六强耀斑和今年释放的最强耀斑。X5.1 级耀斑释放的日冕物质抛射将于 11 月 13 日抵达地球,而之前耀斑释放的日


