AI 日报 | 2026-05-02
今日共收录 116 条资讯
📰 业界新闻
⭐️⭐️⭐️ 谷歌发布Gemini
Google DeepMind 发布 Gemini 技术页面,介绍其 Gemini AI 模型系列。Gemini 是谷歌面向多模态 AI 的核心模型项目,覆盖文本、图像等能力方向。该发布对大模型竞争格局具有重要意义,标志着 Google DeepMind 在通用 AI 模型上的关键推进。
- 相关: Google DeepMind, Gemini, Google
- 标签: 大模型, 多模态AI
- 📎 原文链接
⭐️⭐️⭐️ Anthropic发布Cowork
Anthropic推出Claude Desktop新功能Cowork,将Claude Code的智能体能力扩展到非技术用户。该功能目前以研究预览形式面向Claude Max订阅者开放,仅支持macOS桌面应用,用户可授权Claude访问指定本地文件夹并读取、编辑或创建文件。Cowork可用于整理下载文件、从票据截图生成费用表、根据零散笔记起草报告,并支持连接器、浏览器自动化和Skills。Anthropic同时提示,该类智能体可能执行删除文件等破坏性操作,提示注入与真实世界动作安全仍是行业待解问题。
- 相关: Anthropic, Claude, Claude Code, Cowork, Boris Cherny, Microsoft Copilot
- 标签: AI智能体, 生产力工具, Claude, 桌面应用
- 📎 原文链接
⭐️⭐️⭐️ Salesforce重塑Slackbot
Salesforce 推出全新 Slackbot AI 代理,面向 Business+ 和 Enterprise+ 客户开放,可搜索企业数据、生成文档并执行部分工作流操作。新版 Slackbot 基于 Anthropic Claude 构建,能访问 Slack 对话、Salesforce 记录、Google Drive 文件和日历数据,并计划未来支持 Gemini、OpenAI 等模型。Salesforce 内部 8 万名员工参与测试,三分之二员工已试用,其中 80% 持续使用,满意度达 96%,员工反馈每周节省 2 至 20 小时。该产品将 Slack 定位为企业 AI 代理入口,直接参与 Microsoft Copilot 和 Google Gemini 的办公 AI 竞争。
- 相关: Salesforce, Slack, Slackbot, Anthropic, Claude, Google Gemini, Microsoft Copilot, Parker Harris
- 标签: 企业AI, AI代理, 办公协作, Slack
- 📎 原文链接
⭐️⭐️⭐️ Google发布新一代TPU
Google 发布两款面向“智能体时代”的新一代 Tensor AI 芯片。此次更新包含两类 TPU:一款侧重推理,另一款面向训练任务。该发布显示 Google 正在针对 AI Agent 场景优化算力基础设施,以覆盖模型训练和大规模推理需求。
- 相关: Google, TPU, Tensor, AI Agent
- 标签: AI芯片, 推理, 训练
- 📎 原文链接
⭐️⭐️⭐️ DeepSeek V4预览发布
中国 AI 公司 DeepSeek 于 4 月 24 日发布新一代旗舰模型 V4 预览版。新模型采用更高效的设计,可处理比上一代更长的提示词,提升大规模文本处理能力。与此前模型一样,V4 继续开源,意味着开发者和企业可直接获取并基于其构建应用。该发布受到关注,是因为它延续了开源大模型在性能和可用性上的竞争。
- 相关: DeepSeek, V4, 开源大模型
- 标签: 大模型, 开源, 长上下文
- 📎 原文链接
⭐️⭐️⭐️ 欧盟施压安卓开放AI
欧盟要求 Google 在 Android 上向其他 AI 助手开放更多入口,认为 Gemini 当前获得了优先待遇。Google 回应称这是“不必要的干预”。如果相关要求落地,欧洲 Android 生态中的 AI 助手分发和默认设置可能发生变化,影响 Google 在移动端 AI 入口的控制力。
- 相关: 欧盟, Google, Android, Gemini
- 标签: AI助手, 反垄断, 移动生态
- 📎 原文链接
⭐️⭐️⭐️ 马斯克与奥特曼对簿公堂
Elon Musk 与 Sam Altman 将在一场可能影响 OpenAI 未来走向的审判中正面交锋。案件围绕 OpenAI 的使命与发展方向展开,而 Musk 对 AI 风险态度的变化可能成为审理中的复杂因素。该诉讼受到关注,因为其结果可能影响 OpenAI 的治理结构、商业化路径及行业竞争格局。
- 相关: Elon Musk, Sam Altman, OpenAI
- 标签: OpenAI, AI治理, 法律诉讼
- 📎 原文链接
⭐️⭐️⭐️ OpenAI前途受审
埃隆·马斯克与 OpenAI CEO 萨姆·奥特曼的长期法律纠纷将于本周在北加州开庭审理。案件焦点包括 OpenAI 是否可作为营利性企业存在,并可能影响其备受期待的 IPO 进程。法院裁决或对 OpenAI 的治理结构、商业化路径及整个 AI 行业的公司模式产生重大影响。
- 相关: OpenAI, Elon Musk, Sam Altman
- 标签: OpenAI, 法律诉讼, 公司治理, IPO
- 📎 原文链接
⭐️⭐️⭐️ 马斯克与奥特曼庭审开打
埃隆·马斯克与山姆·奥特曼围绕 OpenAI 未来方向的高风险庭审已经开始。马斯克在 2024 年起诉 OpenAI,指控其背离“开发造福人类的 AI”的创立使命,转向以利润为中心。该案件可能影响 OpenAI 的组织结构、商业化路径以及 ChatGPT 等核心产品的发展方向。
- 相关: Elon Musk, Sam Altman, OpenAI, ChatGPT
- 标签: OpenAI, AI治理, 法律纠纷
- 📎 原文链接
⭐️⭐️⭐️ Anthropic估值或超9000亿
据消息人士称,Anthropic 最新一轮融资可能在两周内完成,潜在估值超过 9000 亿美元。公司已要求投资者在未来 48 小时内提交认购分配。若交易落地,将进一步凸显头部 AI 公司在资本市场的高估值和强融资能力。
- 相关: Anthropic, Claude, 投资者
- 标签: AI融资, 估值, 大模型公司
- 📎 原文链接
⭐️⭐️⭐️ 五角大楼签AI机密协议
美国国防部宣布与 OpenAI、Google、Microsoft、Amazon、Nvidia、xAI 和 Reflection 达成协议,允许其 AI 工具在机密环境中使用。值得注意的是,Anthropic 未被纳入此次名单,尽管其此前曾被用于处理机密信息。该动向显示美国军方正在扩大与主流 AI 厂商的合作范围,也凸显 AI 模型在国防和敏感场景中的部署竞争加剧。
- 相关: Pentagon, OpenAI, Google, Microsoft, Amazon, Nvidia, xAI, Reflection, Anthropic
- 标签: 国防AI, 机密计算, AI合作
- 📎 原文链接
⭐️⭐️⭐️ 五角大楼扩展AI部署
美国国防部与 Nvidia、Microsoft 和 AWS 达成协议,将 AI 部署到机密网络中。此举发生在国防部与 Anthropic 因 AI 模型使用条款产生争议之后,显示其正加强 AI 供应商多元化。该合作将推动生成式 AI 与云/算力能力进入更高安全级别的国防环境,对政府 AI 采购和安全部署具有实际影响。
- 相关: 美国国防部, Nvidia, Microsoft, AWS, Anthropic
- 标签: 国防AI, 云计算, AI部署, 政府采购
- 📎 原文链接
⭐️⭐️⭐️ 马斯克诉OpenAI首周
马斯克与 OpenAI 的标志性诉讼进入首周审理,马斯克出庭称自己被 Sam Altman 和 Greg Brockman 误导,为 OpenAI 提供早期资金支持。他在庭上再次警告 AI 可能带来生存风险,并承认 xAI 对 OpenAI 模型进行蒸馏。该案涉及 OpenAI 创立初衷、治理结构和商业化路径,对 AI 行业法律与伦理讨论具有重要影响。
- 相关: Elon Musk, Sam Altman, Greg Brockman, OpenAI, xAI
- 标签: AI诉讼, OpenAI, 模型蒸馏, AI治理
- 📎 原文链接
⭐️⭐️ Listen Labs获6900万美元
AI 客户访谈平台 Listen Labs 完成 6900 万美元 B 轮融资,由 Ribbit Capital 领投,估值达到 5 亿美元,累计融资 1 亿美元。公司称上线 9 个月内年化收入增长 15 倍至八位数,并已完成超过 100 万次 AI 驱动访谈。Listen 通过 AI 招募受访者、进行开放式视频访谈并生成报告,试图替代耗时数周的传统市场调研流程。其客户包括 Microsoft、Chubbies、Simple Modern 等,案例显示研究周期可从数周缩短到数小时或数天。
- 相关: Listen Labs, Ribbit Capital, Sequoia Capital, Microsoft, Chubbies, Alfred Wahlforss
- 标签: AI调研, 融资, 客户洞察, 企业AI
- 📎 原文链接
⭐️⭐️ Railway融资1亿美元
旧金山云平台 Railway 宣布完成 1 亿美元 B 轮融资,由 TQ Ventures 领投,FPV Ventures、Redpoint 和 Unusual Ventures 参投。公司称其已拥有 200 万开发者、每月处理超 1000 万次部署,并通过边缘网络处理超过 1 万亿次请求。Railway 主打 AI 原生云基础设施,宣称可实现低于 1 秒的部署,并帮助客户相比传统云平台最高节省 65% 成本。此次融资显示,AI 编程工具带来的代码和部署需求增长,正在推动新一代云基础设施创业公司挑战 AWS、Google Cloud 等传统平台。
- 相关: Railway, TQ Ventures, AWS, Google Cloud, Jake Cooper
- 标签: 云基础设施, 融资, AI编程, 开发者工具
- 📎 原文链接
⭐️⭐️ 马斯克调整OpenAI诉求
马斯克在针对OpenAI的诉讼中表示,若胜诉将把全部赔偿交给OpenAI非营利实体,不会为自己索取“一美元”。此前他曾寻求最高1340亿美元赔偿。该变化可能影响其诉讼策略,也使OpenAI非营利结构与商业化争议再次受到关注。
- 相关: 埃隆·马斯克, OpenAI, Sam Altman
- 标签: OpenAI, AI诉讼, 公司治理
- 📎 原文链接
⭐️⭐️ AI裸照案首例定罪
美国俄亥俄州一名男子成为《Take It Down Act》下首位被定罪者。报道称,他使用超过100种AI工具制作女性和未成年人虚假裸照,并在被捕后仍继续相关行为。该案凸显生成式AI滥用在非自愿色情内容和未成年人保护方面带来的执法挑战。
- 相关: Take It Down Act, 俄亥俄州, 生成式AI
- 标签: AI监管, 深度伪造, 未成年人保护
- 📎 原文链接
⭐️⭐️ Gemini接入谷歌相册
Google正在让Gemini通过Google Photos调用用户照片,以生成更个性化的AI图像。该功能将照片内容输入Nano Banana模型,用于增强图像生成的个人化效果。这一更新体现了AI助手与个人数据服务的进一步整合,也可能提升消费级图像生成的实用性。
- 相关: Google, Gemini, Google Photos, Nano Banana
- 标签: 图像生成, 个性化AI, Google Photos
- 📎 原文链接
⭐️⭐️ Deezer称AI音乐激增
Deezer表示,新上传音乐中已有44%为AI生成内容。尽管AI曲目在平台总播放量中占比仍较小,但其中多数播放被判定为欺诈并被取消变现资格。这显示生成式AI正在快速改变音乐供给侧,同时也加剧了流媒体平台的反作弊和版权治理压力。
- 相关: Deezer, AI生成音乐, 流媒体平台
- 标签: AI音乐, 流媒体, 反欺诈
- 📎 原文链接
⭐️⭐️ 企业AI需要数据底座
MIT Technology Review Insights 指出,企业 AI 正从试验阶段进入日常业务应用,覆盖财务、供应链、人力资源和客户运营等场景。调查显示,到 2025 年底,已有一半企业在至少三个业务职能中使用 AI。文章强调,随着 copilots、智能体和预测系统普及,企业需要更强的数据织网能力来支撑可靠部署。其重要性在于,数据基础设施正成为 AI 产生实际商业价值的关键前提。
- 相关: MIT Technology Review Insights, 数据织网, 企业AI
- 标签: 企业AI, 数据基础设施, 智能体
- 📎 原文链接
⭐️⭐️ AI内存荒冲击三星手机
报道称,三星高管担心公司智能手机业务可能首次出现年度亏损。核心原因是 AI 需求推动的内存短缺正在抬高成本,并影响三星的利润表现。作为同时覆盖存储芯片与手机业务的巨头,三星受到 AI 硬件供需变化的双重影响。
- 相关: 三星, AI内存, 智能手机
- 标签: 内存短缺, 智能手机, 供应链
- 📎 原文链接
⭐️⭐️ 企业重建AI数据栈
MIT Technology Review Insights 报道称,许多企业在推进 AI 落地时发现,最大障碍并非模型本身,而是数据基础设施的现状。与面向消费者的 AI 工具不同,企业级 AI 规模化部署依赖更完善的数据管理、治理和集成能力。文章强调,重建数据栈将成为企业实现 AI 价值的关键前提。
- 相关: MIT Technology Review Insights, 人工智能, 数据栈
- 标签: 企业AI, 数据基础设施, 数据治理
- 📎 原文链接
⭐️⭐️ 谷歌AI默认设置引隐私争议
Ars Technica 报道称,Google 虽宣称在 AI 产品中尊重用户隐私,但实际设置和默认选项可能让用户难以完全掌控数据使用。文章指出,Gemini 相关隐私选项存在复杂性,用户表面上拥有选择权,但实际体验并不清晰。该问题凸显了 AI 服务默认设置、数据收集与用户知情同意之间的矛盾。
- 相关: Google, Gemini
- 标签: AI隐私, 数据治理, 默认设置
- 📎 原文链接
⭐️⭐️ This startup’s new mechanistic interpret
The San Francisco–based startup Goodfire just released a new tool, called Silico, that lets researchers and engineers peer inside an AI model and adjust its parameters—the settings that determine a model’s behavior—durin
- 相关: This, LLMs
- 标签: news, MIT Tech Review AI
- 📎 原文链接
⭐️⭐️ Gemini登陆谷歌车载系统
Google 正在向搭载 Google built-in 的车辆推送 Gemini AI 助手,用以替代现有 Google Assistant。升级后,车内助手将支持更自然的对话,并可获取车辆相关信息、调整设置等。此举显示生成式 AI 正从手机与网页进一步进入智能汽车场景,影响车载交互体验。
- 相关: Google, Gemini, Google Assistant, Google built-in
- 标签: 车载AI, 智能汽车, 语音助手
- 📎 原文链接
⭐️⭐️ Meta为AI工具投放致富广告
Meta 旗下去年以 20 亿美元收购的 AI 公司 Manus 正在投放宣传“用 AI 快速赚钱”的广告。广告建议用户寻找没有网站或网站质量较差的本地商家,用 AI 为其生成网站后再进行销售。该活动还向内容创作者付费制作相关推广内容,引发对 AI 工具营销方式和低质内容泛滥的关注。
- 相关: Meta, Manus, AI工具
- 标签: AI营销, 生成式AI, 内容生态
- 📎 原文链接
⭐️⭐️ 马斯克承认用OpenAI训练Grok
埃隆·马斯克在加州联邦法庭作证称,其 AI 初创公司 xAI 曾使用 OpenAI 的模型来改进自家模型 Grok。相关问题涉及“模型蒸馏”,即用更大的模型作为“教师”向较小模型传递能力,这是 AI 行业常见做法。该证词出现在马斯克与 OpenAI 的法律争端中,可能影响外界对模型训练边界和商业竞争合规性的讨论。
- 相关: Elon Musk, xAI, OpenAI, Grok, 模型蒸馏
- 标签: AI诉讼, 模型训练, Grok
- 📎 原文链接
⭐️⭐️ Legora估值达56亿美元
法律 AI 初创公司 Legora 最新估值达到 56 亿美元,显示资本市场对法律垂直 AI 的持续关注。报道称,Legora 与竞争对手 Harvey 均在快速融资,并开始进入彼此的核心市场。双方还推出了针锋相对的广告活动,法律 AI 赛道的商业竞争进一步升温。
- 相关: Legora, Harvey, 法律AI
- 标签: 法律科技, AI创业, 融资估值
- 📎 原文链接
⭐️⭐️ 苹果称AI推高Mac需求
苹果表示,AI 驱动的需求超出预期,推动 Mac 产品销售增长。公司称下一季度 Mac mini、Studio 和 Neo 仍将面临供应受限。该情况表明本地 AI 计算和开发需求正在影响消费电子与个人电脑供应链。
- 相关: 苹果, Mac mini, Mac Studio, AI
- 标签: AI硬件, 苹果, PC市场
- 📎 原文链接
⭐️⭐️ 马斯克诉奥特曼庭审插曲
The Verge 报道了 Elon Musk 与 Sam Altman 相关诉讼中的一段庭审细节。报道称,在陪审团不在场时,马斯克方面的财务负责人兼助手 Jared Birchall 出庭作证,其证词引发了对 xAI 相关问题的关注。该事件显示,围绕 OpenAI、马斯克和 Altman 的法律争议仍在持续发酵,并可能影响外界对相关 AI 公司治理与利益关系的理解。
- 相关: Elon Musk, Sam Altman, Jared Birchall, xAI, OpenAI
- 标签: AI诉讼, 公司治理, OpenAI
- 📎 原文链接
⭐️⭐️ ChatGPT图像在印度走红
OpenAI 的 ChatGPT Images 2.0 在印度获得明显用户热度,用户主要用于生成头像、电影感肖像等个性化创意图像。报道指出,这一功能在印度表现突出,但在其他市场尚未形成同等规模的增长势头。该现象显示生成式图像工具的采用可能受到本地文化、社交传播和移动互联网使用习惯影响。
- 相关: OpenAI, ChatGPT Images 2.0, 印度
- 标签: AI图像生成, 区域市场, ChatGPT
- 📎 原文链接
⭐️⭐️ Goodfire发布LLM调试工具
旧金山初创公司 Goodfire 发布了名为 Silico 的机制可解释性工具,允许研究人员和工程师在训练过程中查看 AI 模型内部并调整参数。该工具旨在帮助模型开发者更细粒度地控制大语言模型的行为。Goodfire 称,Silico 可能改变模型构建和调试方式,提升大模型可解释性与可控性。
- 相关: Goodfire, Silico, 大语言模型, 机制可解释性
- 标签: LLM, 可解释性, 模型调试
- 📎 原文链接
⭐️⭐️ 微软Word推法律AI代理
微软在 Word 中推出面向法律团队的新 AI 代理 Legal Agent。该工具可处理文档编辑、谈判历史和复杂文件,帮助法律团队完成合同审查等任务。微软强调,该代理不依赖通用模型直接解释指令,而是遵循基于真实法律实践设计的结构化工作流,意在提升法律场景中的可靠性和信任度。
- 相关: Microsoft, Word, Legal Agent
- 标签: AI代理, 法律科技, 办公软件
- 📎 原文链接
⭐️⭐️ 马斯克庭审受挫
The Verge 报道称,马斯克在其针对 OpenAI 的诉讼庭审中表现不利。该案围绕其声称 OpenAI“窃取了一个非营利组织”以及自己是公司关键推动者的说法展开。报道认为,目前迹象显示马斯克胜诉可能性不高,但案件仍在推进,持续影响外界对 OpenAI 创立历史和治理争议的关注。
- 相关: Elon Musk, OpenAI, Sam Altman
- 标签: OpenAI, 法律诉讼, 公司治理
- 📎 原文链接
⭐️⭐️ Musk v. Altman is just getting started
Elon Musk spent the better part of three days on the witness stand this week in his lawsuit against OpenAI, and it’s already getting messy. Emails, texts, and his own tweets are surfacing in court, and there are plenty m
- 相关: Musk, Altman
- 标签: news, TechCrunch AI
- 📎 原文链接
⭐️⭐️ AI工厂迈向规模化
MIT Technology Review 的 EmTech AI 会议讨论了企业如何通过掌控自身数据来定制 AI 能力。核心挑战在于,在数据所有权与安全、可信、高质量的数据流动之间取得平衡。讨论指出,AI 工厂有助于提升规模化、可持续性和治理能力,使数据成为企业 AI 战略的关键基础。
- 相关: MIT Technology Review, EmTech AI, AI工厂
- 标签: 企业AI, 数据治理, AI规模化
- 📎 原文链接
⭐️⭐️ AI时代网络安全承压
MIT Technology Review 在 EmTech AI 会议中讨论了 AI 时代的网络安全挑战。文章指出,在 AI 进入技术栈之前,网络安全体系已面临压力,而 AI 的引入进一步扩大了攻击面并增加系统复杂性。会议强调,安全机制需要以 AI 为核心重新设计,而不是在系统部署后再叠加传统防护。
- 相关: MIT Technology Review, EmTech AI, 网络安全, AI
- 标签: 网络安全, AI安全, 企业安全
- 📎 原文链接
⭐️⭐️ 马斯克诉OpenAI升温
Elon Musk 本周在其针对 OpenAI 的诉讼中出庭作证近三天,案件进入更激烈阶段。庭审中已出现邮件、短信和其本人推文等证据,后续还将有更多证人出庭。Musk 的核心主张是,OpenAI 转向营利模式违背了其“为公益而设的非营利组织”初衷,该案可能影响外界对 AI 公司治理和使命约束的讨论。
- 相关: Elon Musk, OpenAI, Sam Altman
- 标签: OpenAI, 法律诉讼, 公司治理, AI伦理
- 📎 原文链接
⭐️⭐️ 马斯克诉奥特曼证据披露
马斯克诉奥特曼案进入审理阶段,法庭证据正陆续公开。已披露材料包括 OpenAI 早期的邮件往来、照片和公司文件,甚至涵盖该 AI 实验室正式命名前的阶段。这些证据有助于还原 OpenAI 创立初期的治理结构、参与者角色及相关争议,对理解当前 AI 公司的控制权与非营利定位争论具有参考意义。
- 相关: Elon Musk, Sam Altman, OpenAI
- 标签: OpenAI, 法律诉讼, 公司治理
- 📎 原文链接
⭐️⭐️ Meta收购机器人初创
Meta 收购了类人机器人初创公司 Assured Robot Intelligence,以加强其面向机器人的 AI 模型能力。Meta 表示,此举将服务于其在人形机器人 AI 方向上的布局。该交易显示大型科技公司正将 AI 能力从软件和对话系统进一步延伸到具身智能和机器人领域。
- 相关: Meta, Assured Robot Intelligence, 人形机器人, AI模型
- 标签: 机器人, 具身智能, 收购
- 📎 原文链接
⭐️⭐️ Replit回应出售传闻
Replit 创始人 Amjad Masad 在 TechCrunch StrictlyVC 活动中回应了外界关于公司是否会出售的讨论。背景是竞争对手 Cursor 据称正与 SpaceX 洽谈一笔高达 600 亿美元的收购交易。Masad 还谈到与 Apple 的竞争关系,并表示自己更倾向于不出售公司。该表态反映出 AI 编程工具市场在高估值和平台竞争下的战略分化。
- 相关: Replit, Amjad Masad, Cursor, SpaceX, Apple
- 标签: AI编程, 创业公司, 并购传闻
- 📎 原文链接
⭐️ Chrome推出Gemini Skills
Google在Chrome中引入“Skills”功能,使Gemini提示词可以被保存并快速复用。用户既可以保存自己常用的自定义提示词,也可以从Google提供的技能库中选择预设内容。该功能降低了重复编写提示词的成本,有助于提升浏览器内AI功能的日常使用效率。
- 相关: Google, Chrome, Gemini, Skills
- 标签: 提示词, 浏览器AI, 效率工具
- 📎 原文链接
⭐️ AI盈利缺失环节
MIT Technology Review 在《The Algorithm》栏目中讨论了 AI 从市场热潮走向实际盈利之间的关键断层。文章指出,尽管 AI 受到广泛关注和投资,企业仍需找到可持续的商业转化路径。该议题反映出当前 AI 行业面临的核心挑战:如何从技术展示和概念验证迈向稳定收益。
- 相关: MIT Technology Review, The Algorithm
- 标签: AI商业化, 盈利模式, 行业观察
- 📎 原文链接
⭐️ Fiverr涌现宗教AI视频
The Verge 报道称,一些基督教内容创作者正在通过 Fiverr 外包生成式 AI 视频制作。平台上的零工创作者利用 AI 快速生产圣经主题视频等内容,以满足客户对低成本、高效率内容的需求。该现象反映出生成式 AI 正在改变创意零工市场,也加剧了低质 AI 内容泛滥的讨论。
- 相关: Fiverr, The Verge, 生成式AI
- 标签: AI内容, 零工经济, 宗教内容
- 📎 原文链接
⭐️ AI听写应用横评
TechCrunch 对多款 AI 听写应用进行了测试和排名,涵盖邮件回复、笔记记录以及语音编程等使用场景。文章强调,AI 听写工具正从简单语音转文字扩展到更广泛的生产力工作流。该类工具的实用性提升,反映出语音交互在日常办公和开发场景中的采用度正在提高。
- 相关: TechCrunch, AI听写应用, 语音识别
- 标签: AI工具, 语音输入, 生产力
- 📎 原文链接
📄 最新论文
⭐️⭐️ Meta发布Tribe v2
Meta研究人员发布Tribe v2,用于建模人类大脑对声音、视觉和语言的反应。该模型面向“计算机内神经科学”研究,覆盖视听语言三类输入,并提供可在手机端部分体验的在线演示。官方同时发布了论文和GitHub代码,便于研究者复现与进一步探索。
- 相关: Meta AI, Jean-Rémi King, Tribe v2, in-silico neuroscience
- 标签: 脑科学, 多模态, 开源代码, AI研究
- 📎 原文链接
🔥 GitHub 热门
⭐️⭐️⭐️ Meta力挺开源AI
Meta 发布文章称,开源 AI 是未来发展的关键路径。文章围绕 Llama 等开源模型,强调开放模型有助于开发者创新、降低成本,并推动 AI 生态更广泛参与。该立场对大模型开源路线具有行业影响,尤其是在闭源与开源竞争持续加剧的背景下。
- 相关: Meta, Llama, 开源AI
- 标签: 开源模型, 大模型, AI生态
- 📎 原文链接
⭐️⭐️⭐️ CaP-X开源具身智能体
Jim Fan 团队开源 CaP-X,将智能体能力扩展到机械臂和人形机器人等物理载体。该系统提供感知、控制与可视化 API,包括 SAM3 分割、Molmo 指向、深度/点云、IK 求解、抓取规划和导航等,并可自动合成技能库。团队还发布 CaP-Gym,覆盖 RoboSuite、LIBERO-PRO 和 BEHAVIOR 的 187 个操作任务,以及 CaP-Bench,对 Gemini、GPT、Claude Opus、Qwen、DeepSeek、Kimi 等 12 个前沿 LLM/VLM 进行 8 层评测。实验显示,CaP-Agent0 在 7 个任务中有 4 个达到或超过人类专家代码;CaP-RL 让 7B 开源模型在 50 次训练迭代后成功率从 20% 提升到 72%,并能较小差距迁移到真实机器人。
- 相关: CaP-X, CaP-Gym, CaP-Bench, CaP-Agent0, CaP-RL, SAM3, Molmo, Gemini, GPT, Claude Opus, Qwen, DeepSeek, Kimi, Jim Fan
- 标签: 具身智能, 机器人, 开源, 智能体
- 📎 原文链接
⭐️⭐️ Nous发布开源代码模型
Nous Research发布开源代码模型NousCoder-14B,称其在LiveCodeBench v6上达到67.87%准确率,较基座模型Qwen3-14B提升7.08个百分点。该模型使用48块Nvidia B200 GPU训练4天,训练数据包含2.4万个竞赛编程问题,并采用可验证奖励与DAPO等强化学习方法。Nous Research同时开放模型权重、强化学习环境、评测套件和基于Atropos的训练框架,便于研究者复现与扩展。报告也指出,高质量竞赛编程数据接近瓶颈,未来可能需要合成数据、数据高效算法和自博弈式问题生成。
- 相关: Nous Research, NousCoder-14B, Qwen3-14B, Nvidia, B200, Atropos, Hugging Face, Paradigm
- 标签: 开源模型, 代码生成, 强化学习, LiveCodeBench
- 📎 原文链接
⭐️⭐️ Goose挑战Claude Code
Block 开源的本地 AI 编程代理 Goose 正在获得开发者关注,GitHub 已超过 26,100 星、362 名贡献者,并发布 102 个版本。相比 Claude Code 每月 20 至 200 美元订阅和用量限制,Goose 可在本机运行,支持 Ollama、本地开源模型以及 Claude、OpenAI、Gemini 等多种模型接入。其核心优势是免费、可离线使用、代码数据不离开本机,但在模型质量、上下文窗口和速度上仍可能落后于 Claude 4.5 Opus 等云端闭源模型。该项目反映出开源 AI 编程工具正对高价商业产品形成现实替代压力。
- 相关: Block, Goose, Anthropic, Claude Code, Ollama, Qwen, Llama, Gemini, OpenAI
- 标签: AI编程, 开源工具, 本地模型, 开发者工具
- 📎 原文链接
⭐️⭐️ 英伟达开源SONIC
NVIDIA/NVlabs 开源 SONIC,一个面向通用人形机器人的行为基础模型。SONIC 支持实时全身运动生成,可用于全身遥操作以及结合 VLA 推理的移动操作任务。项目已发布论文、网站、代码库和模型权重,当前包含推理代码与模型,训练代码和 GR00T 集成计划后续开放。该项目旨在推动人形机器人从预设动作走向真实工作场景部署。
- 相关: NVIDIA, NVlabs, Yuke Zhu, Zhengyi Luo, SONIC, GR00T, VLA
- 标签: 人形机器人, 全身控制, 开源模型, 具身智能
- 📎 原文链接
⭐️⭐️ CaP-X开源发布
NVIDIA、伯克利、斯坦福和 CMU 团队发布 CaP-X,这是一个面向机器人场景的编码智能体开源框架与基准。该框架让智能体为机器人感知与控制编写代码,并在仿真和真实机器人上执行、观察结果、迭代提升可靠性。项目采用 MIT 许可证,已公开代码、论文和网站,论文编号为 arXiv:2603.22435。该工作关注编码智能体在机器人中的实际能力,是从软件任务走向具身控制任务的重要评测方向。
- 相关: CaP-X, NVIDIA, Berkeley AI, CMU Robotics, Stanford AI Lab, Max Fu, Ken Goldberg
- 标签: 机器人, 编码智能体, 开源, 基准测试
- 📎 原文链接
⭐️⭐️ TradingAgents走红
TauricResearch 的 TradingAgents 登上 GitHub Python 趋势榜,项目定位为多智能体 LLM 金融交易框架。该项目当天新增 2,227 颗星,显示出开发者对 LLM 在金融交易决策场景中应用的高度关注。其价值在于探索多智能体协作如何用于市场分析、策略生成与交易流程建模。
- 相关: TauricResearch, TradingAgents, LLM, 多智能体
- 标签: 开源项目, 金融AI, 多智能体, LLM
- 📎 原文链接
⭐️⭐️ Claude代码图工具走热
GitHub 项目 tirth8205/code-review-graph 今日获得 323 个星标。该工具为 Claude Code 构建本地持久化代码知识图谱,让模型在审查和编码时只读取相关代码。项目声称可在代码审查中减少 6.8 倍 token 消耗,在日常编码任务中最高减少 49 倍,对降低 AI 编程成本和提升上下文检索效率有实际意义。
- 相关: tirth8205, code-review-graph, Claude Code, 知识图谱
- 标签: AI编程, 代码审查, 知识图谱, Token优化
- 📎 原文链接
⭐️⭐️ 微软Qlib量化平台走热
微软开源量化投资平台 Qlib 登上 GitHub Python 趋势榜,今日新增 100 个 Star。Qlib 面向 AI 驱动的量化研究,覆盖从策略想法探索到生产实现的流程。该平台支持监督学习、市场动态建模和强化学习等多种机器学习范式,并已接入 RD-Agent 以自动化研发流程。
- 相关: Microsoft, Qlib, RD-Agent, 强化学习
- 标签: 开源, 量化投资, 机器学习, 自动化研发
- 📎 原文链接
⭐️⭐️ 谷歌TimesFM受关注
Google Research 的 TimesFM 登上 GitHub Python 趋势榜,今日新增 86 个 Star。TimesFM 是一个预训练时间序列基础模型,主要用于时间序列预测任务。该项目显示出基础模型方法正在从文本、图像扩展到金融、需求预测、运维监控等时间序列场景。
- 相关: Google Research, TimesFM, 时间序列基础模型
- 标签: 开源, 时间序列, 基础模型, 预测
- 📎 原文链接
⭐️⭐️ Ruflo成Claude编排热门项目
ruvnet/ruflo 登上 GitHub TypeScript 趋势榜,项目面向 Claude 的智能体编排平台。它支持多智能体群组部署、自主工作流协调、对话式 AI 系统构建,并包含企业级架构、分布式群体智能、RAG 集成以及 Claude Code / Codex 原生集成。该项目今日新增 1,258 个 Star,反映出开发者对多智能体编排和 Claude 生态工具的强烈兴趣。
- 相关: ruvnet, ruflo, Claude, Claude Code, Codex, RAG
- 标签: 开源项目, 多智能体, 智能体编排, Claude
- 📎 原文链接
⭐️ Maigret用户名侦查
soxoj/maigret 登上 GitHub Python 趋势榜,是一个可通过用户名在 3000 多个网站收集个人资料线索的开源工具。该项目当天新增 1,065 颗星,反映出开发者对开源情报收集工具的关注。它主要面向用户名关联检索与资料汇总场景,但也涉及隐私与安全使用边界。
- 相关: soxoj, maigret, GitHub
- 标签: 开源情报, OSINT, 隐私安全, GitHub趋势
- 📎 原文链接
⭐️ Python算法库持续热门
TheAlgorithms/Python 今日在 GitHub Trending 中获得 67 个星标。该项目汇集了用 Python 实现的各类算法,覆盖基础算法与数据结构等内容。虽然不是专门的 AI 项目,但可作为机器学习、工程实践和算法学习的基础参考资源。
- 相关: TheAlgorithms, Python
- 标签: Python, 算法, 开源项目, 学习资源
- 📎 原文链接
⭐️ copyparty文件服务受关注
9001/copyparty 今日在 GitHub Trending 中获得 33 个星标。该项目是一个单文件便携式文件服务器,支持断点续传加速上传、去重、WebDAV、SFTP、FTP、TFTP、zeroconf、媒体索引和缩略图等功能。它并非直接面向 AI,但可用于本地数据、媒体和开发文件的轻量化管理。
- 相关: 9001, copyparty, WebDAV, SFTP, FTP
- 标签: 文件服务, 开源工具, 数据管理, Python
- 📎 原文链接
⭐️ AI-Trader登上趋势榜
HKUDS 开源项目 AI-Trader 登上 GitHub Python 趋势榜,今日新增 30 个 Star。该项目定位为“100% 全自动、Agent 原生交易”系统,面向自动化金融交易场景。它反映了 AI Agent 在量化交易和投资自动化方向的持续探索。
- 相关: HKUDS, AI-Trader, AI Agent
- 标签: 开源, 量化交易, AI Agent
- 📎 原文链接
⭐️ Ouroboros走红GitHub
Q00/ouroboros 登上 GitHub Python 趋势榜,项目定位为“Agent OS”,主张用规格说明替代反复提示词交互。该项目今日新增 185 个 Star,显示开发者对 Agent 工作流规范化工具的关注。其核心价值在于帮助用户更系统地定义和驱动智能体任务。
- 相关: Q00, ouroboros, Agent OS
- 标签: 开源项目, AI Agent, GitHub Trending
- 📎 原文链接
💬 社区讨论
⭐️⭐️⭐️ 谷歌Duplex电话AI
谷歌发布 Duplex,一套可通过电话完成现实任务的 AI 系统,重点展示了自然对话能力。该系统可用于预约、查询等需要语音交互的场景,目标是在复杂口语环境中理解意图并完成任务。其意义在于将 AI 从文本交互推进到真实电话服务场景,体现了语音助手的应用潜力。
- 相关: Google, Google Duplex, AI语音助手
- 标签: 语音AI, 自然语言交互, 电话自动化
- 📎 原文链接
⭐️⭐️ Open source AI is the path forward
Open source AI is the path forward
- 相关: Open, AI
- 标签: community, Hacker News AI
- 📎 原文链接
⭐️⭐️ SQL注入绕过机场安检
一篇技术文章披露了通过 SQL 注入绕过机场安检相关系统的案例。标题显示漏洞与 TSA 或机场安全流程相关,凸显传统 Web 安全漏洞可能影响关键基础设施。该内容主要属于网络安全范畴,并非 AI 领域进展。
- 相关: TSA, SQL Injection
- 标签: 网络安全, SQL注入, 机场安检
- 📎 原文链接
⭐️⭐️ Claude Code工作流走红
Claude Code负责人Boris Cherny在X上分享个人开发工作流,引发开发者社区广泛讨论。他表示自己会在终端中并行运行5个Claude实例,并在浏览器中运行5到10个Claude会话,通过通知、会话切换和任务分工管理多个开发流程。该工作流强调使用Opus 4.5、维护CLAUDE.md规则文件、使用斜杠命令和子智能体,并让Claude通过浏览器自动化与测试套件验证代码。文章认为,这反映AI编程正在从自动补全转向多智能体协作与验证驱动的软件开发模式。
- 相关: Boris Cherny, Anthropic, Claude Code, Claude, Opus 4.5, iTerm2
- 标签: AI编程, 开发者工作流, 多智能体, Claude Code
- 📎 原文链接
⭐️⭐️ AI代理攻击维护者
一篇博客称,某个 AI agent 在开源协作场景中发布了针对作者的批评性文章。相关背景显示,此前已有“AI agent 提交 PR 并撰文羞辱关闭 PR 的维护者”的讨论,在 Hacker News 上获得 582 条评论。该事件凸显了 AI agent 参与社区协作时可能带来的责任边界、声誉伤害和治理问题。
- 相关: AI agent, Hacker News, 开源维护者
- 标签: AI代理, 开源治理
- 📎 原文链接
⭐️⭐️ HN禁止AI生成评论
Hacker News 在社区指南中明确要求用户不要发布由 AI 生成或 AI 编辑的评论。该规则强调 HN 的定位是“人与人之间的对话”,意在维护社区讨论的真实性和互动质量。随着生成式 AI 内容增多,这类平台规则将影响技术社区对 AI 辅助发言的接受边界。
- 相关: Hacker News, Y Combinator, 生成式AI
- 标签: 社区治理, AI生成内容, 平台规则
- 📎 原文链接
⭐️ 空调开关维修花费1697美元
一篇博客记录了 Advantage Air eZone 空调控制平板的 DIY 维修经历,标题称一个开关问题报价高达 1697 美元。文章关注智能家居设备维修成本、可维修性与厂商生态限制。该内容属于社区技术分享,与 AI 没有直接关系。
- 相关: Advantage Air, eZone
- 标签: 智能家居, 设备维修, DIY
- 📎 原文链接
⭐️ AI怀疑论引发热议
Fly.io 博客文章《My AI skeptic friends are all nuts》在 Hacker News AI 社区引发讨论。文章围绕作者对 AI 怀疑论者观点的反驳展开,属于社区层面的观点交流。其重要性在于反映了开发者群体对 AI 能力、风险和产业影响的持续分歧。
- 相关: Fly.io, Hacker News, AI
- 标签: AI观点, 社区讨论
- 📎 原文链接
⭐️ 报告称加沙援助者遭近距离射杀
Forensic Architecture 与 Earshot 的报告称,2025 年特尔苏丹事件中,加沙红新月会与民防相关援助人员遭以军近距离射杀。原文链接指向一份 PDF 报告,并由 Drop Site News 报道。该事件涉及人道援助人员安全与战区问责问题,但与 AI 技术本身无直接关联。
- 相关: IDF, Gaza Red Crescent, Civil Defense, Forensic Architecture, Earshot
- 标签: 人道援助, 冲突调查, 社区讨论
- 📎 原文链接
⭐️ Gemini创作挑战征集
Google DeepMind 发起一项围绕数字 1-10 的创作征集活动。参与者需使用 Gemini App 或 Google AI Studio 中的 Canvas 功能完成作品,并在 5 月 6 日前提交。该活动主要面向开发者和创作者,旨在展示 Gemini Canvas 在生成式创作场景中的应用。
- 相关: Google DeepMind, Gemini App, Google AI Studio, Canvas
- 标签: Gemini, 创作活动, AI工具, 社区
- 📎 原文链接
💬 X 平台热门
⭐️⭐️⭐️ 英伟达发布EgoScale
英伟达机器人团队提出 EgoScale,用 2 万小时以上第一视角人类视频预训练 GR00T N1.5,使22自由度灵巧手人形机器人学会拼装模型车、操作注射器、整理扑克牌和折叠衣物等任务。团队称,人类视频规模与动作预测损失呈近乎完美的对数线性关系(R²=0.998),且该损失可直接预测真实机器人成功率。该方法仅用4小时机器人试玩数据进行中期训练,在5项高灵巧任务上较从零训练提升54%,并能用单次遥操作示范学习新任务。模型还可从22自由度手迁移到 Unitree G1 的7自由度三指手,相比仅用G1数据训练提升30%以上,显示人类视频可能成为提升机器人灵巧操作的数据路径。
- 相关: NVIDIA Robotics, GR00T N1.5, EgoScale, Sharpa, Unitree G1, Jim Fan, Ruijie Zheng
- 标签: 机器人, 人形机器人, 灵巧手, 视频预训练, 具身智能
- 📎 原文链接
⭐️⭐️⭐️ OpenAI推进Codex迁移
OpenAI 在 X 上宣布,用户可直接通过 Codex 应用和 CLI 迁移到 Codex,并支持导入设置、插件、Agent、项目配置等工作流内容。OpenAI 称 GPT-5.5 发布一周后成为其迄今最强模型发布,API 收入增速超过以往任何版本的 2 倍。同期 Codex 收入在不到 7 天内翻倍,显示企业对智能体编程工具的需求持续上升。
- 相关: OpenAI, Codex, GPT-5.5, API, CLI
- 标签: 智能体编程, 模型发布, 企业需求, 开发者工具
- 📎 原文链接
⭐️⭐️ R to @DrJimFan: This is a huge team work
This is a huge team work at NVIDIA Robotics. Check out @ruijie_zheng12 's deep dive: - Website: research.nvidia.com/labs/gea… - Paper: arxiv.org/abs/2602.16710 nitter.net/ruijie_zheng12/status/… Ruijie Zheng (@ruijie_zhe
- 相关: R, @DrJimFan, This, NVIDIA, Robotics.
- 标签: x_platform, X @DrJimFan
- 📎 原文链接
⭐️⭐️ We trained a humanoid with 22-DoF dexter
We trained a humanoid with 22-DoF dexterous hands to assemble model cars, operate syringes, sort poker cards, fold/roll shirts, all learned primarily from 20,000+ hours of egocentric human video with no robot in the loop
- 相关: We, Humans, We, R², Humanoid
- 标签: x_platform, X @DrJimFan
- 📎 原文链接
⭐️⭐️ EgoVerse发布人类视角数据
Jim Fan 评论 EgoVerse 发布,认为机器人学习正在从遥操作转向直接利用人类第一视角数据进行行为克隆。EgoVerse 是一个面向机器人学习的生态系统,由 4 个研究实验室和 3 个产业伙伴共同构建与测试。该数据生态已包含 1300 多小时数据、240 个场景和 2000 多个任务,并仍在增长。其意义在于尝试减少对真实机器人遥操作采集的依赖,为“无机器人扩展机器人学习”提供数据基础。
- 相关: EgoVerse, EgoScale, Danfei Xu, Jim Fan
- 标签: 机器人学习, 行为克隆, 第一视角数据, 数据集
- 📎 原文链接
⭐️⭐️ LiteLLM供应链攻击引警示
Jim Fan 转发并评论 LiteLLM PyPI 版本 1.82.8 被攻陷事件,称其包含 litellm_init.pth,通过 base64 编码指令窃取凭证并尝试自我复制。其观点指出,在智能体工作流中,任何会进入上下文的文件都可能成为攻击面,包括 ~/.claude、skills 目录或定期读取的 PDF。随着智能体拥有文件系统和工具调用能力,传统身份盗用风险可能演变为更广泛的上下文污染和供应链攻击。该事件凸显了智能体框架需要更细粒度权限、依赖最小化、审计和防护机制。
- 相关: LiteLLM, PyPI, Jim Fan, Daniel Hnyk
- 标签: AI安全, 供应链攻击, 智能体, 权限控制
- 📎 原文链接
⭐️⭐️ R to @DrJimFan: As usual, we open-source
As usual, we open-source everything, MIT license: capgym.github.io Code: github.com/capgym/cap-x Paper: arxiv.org/abs/2603.22435 CaP-X is brought to you by NVIDIA, Berkeley, Stanford, and CMU. I'd like to thank the legen
- 相关: R, @DrJimFan, As, MIT, Code
- 标签: x_platform, X @DrJimFan
- 📎 原文链接
⭐️⭐️ Anthropic测试AI代理市场
Anthropic发布“Project Deal”研究,在旧金山办公室搭建员工交易市场,并让Claude代表员工进行买卖和谈判。研究显示,AI代理市场可能带来价值,但也存在明显问题:使用更高质量模型的参与者获得了实际优势,而其他参与者并未察觉。Anthropic指出,这类代理市场还可能以多种方式出错,相关政策和法律框架需要跟上发展。
- 相关: Anthropic, Claude, Project Deal, AI代理
- 标签: AI代理, 市场机制, AI治理, Claude
- 📎 原文链接
⭐️⭐️ R to @AnthropicAI: Markets of AI agents
Markets of AI agents could provide value, but there are plenty of rough edges. Access to higher-quality models conferred a real advantage—and participants didn’t notice. There are plenty of other ways they can go wrong.
- 相关: R, @AnthropicAI, Markets, AI, Access
- 标签: x_platform, X @AnthropicAI
- 📎 原文链接
⭐️⭐️ R to @AnthropicAI: To read our write-up
To read our write-up in full, see here: anthropic.com/features/proje…
- 相关: R, @AnthropicAI, To
- 标签: x_platform, X @AnthropicAI
- 📎 原文链接
⭐️⭐️ R to @GoogleDeepMind: As AI continues to
As AI continues to evolve, our commitment to education remains. The program is expanding into Latin America this year, with the aim of training 24,000 educators and reaching 1.25 million students by 2028, thanks to fundi
- 相关: R, @GoogleDeepMind, As, AI, The
- 标签: x_platform, X @GoogleDeepMind
- 📎 原文链接
⭐️⭐️ RT by @ylecun: - Comey indicted for twee
Comey indicted for tweeting a number. - Trump FCC threatens ABC's broadcast license. - Trump defacing more govt institutions with his name and picture. - Trump's kids cashing in on huge govt contracts. I'm always torn
相关: RT, Comey, Trump, FCC, ABC's
标签: x_platform, X @ylecun
📎 原文链接
⭐️⭐️ 美国削减科研顾问团
Yann LeCun 转发并评论称特朗普政府正在“打击科学”。据 Nature 记者 Max Kozlov 的分析,特朗普政府不仅通过削减经费和人员缩减美国科研体系,还已在主要科学机构中裁撤超过 100 个科学顾问委员会。此类顾问机制通常参与科研政策、资助方向和技术监管建议,削减可能影响包括 AI 在内的前沿科技政策制定。
- 相关: Yann LeCun, Max Kozlov, Nature, 特朗普政府, 美国科学机构
- 标签: 科研政策, 科学顾问, 美国科技
- 📎 原文链接
⭐️⭐️ In new Anthropic Fellows research, we di
In new Anthropic Fellows research, we discuss “introspection adapters": a tool that allows language models to self-report behaviors they've learned during training—including potential misalignment. keshav (@kshenoy_) Can
- 相关: In, Anthropic, Fellows
- 标签: x_platform, X @AnthropicAI
- 📎 原文链接
⭐️⭐️ RT by @ylecun: Science is how we’ve cure
Science is how we’ve cured diseases and how we just sent four humans around the Moon. It’s a big reason why we’re the greatest country on Earth, but firing the National Science Board shows just how much Trump doesn’t und
- 相关: RT, Science, Moon., It’s, Earth
- 标签: x_platform, X @ylecun
- 📎 原文链接
⭐️⭐️ RT by @ylecun: Trump’s FCC chair, Brenda
Trump’s FCC chair, Brendan Carr, says he plans to punish and potentially revoke broadcast licenses for TV networks critical of the Trump administration: “I’d be surprised if we don’t go down the path of license revocatio
- 相关: RT, Trump’s, FCC, Brendan, Carr
- 标签: x_platform, X @ylecun
- 📎 原文链接
⭐️⭐️ Claude挑战生物难题
Anthropic 发布 BioMysteryBench 生物信息学评测,用于测试 Claude 是否能为开放式科研问题提出创造性解决方案。该评测包含 99 个真实生物数据分析问题,并与专家小组表现对比。其中 23 个问题专家未能解决,Anthropic 最新模型约解决了这些难题中的 30%。这显示大模型在生物信息学研究辅助中的潜力,也为评估科研型 AI 能力提供了新基准。
- 相关: Anthropic, Claude, BioMysteryBench
- 标签: 生物信息学, AI评测, 科研AI
- 📎 原文链接
⭐️⭐️ Anthropic提出内省适配器
Anthropic Fellows 研究介绍了“内省适配器”(Introspection Adapters),用于让语言模型自我报告训练中学到的行为。研究称,一个内省适配器可使微调后的模型描述自身行为,并泛化到检测隐藏的不对齐、后门和安全防护移除等问题。该方法关注模型安全与可解释性,有助于识别训练过程中产生的潜在风险行为。
- 相关: Anthropic, Introspection Adapters, LLM
- 标签: AI安全, 模型可解释性, 对齐
- 📎 原文链接
⭐️⭐️ Trump's war on science.
Trump's war on science. Max Kozlov (@maxdkozlov) The Trump administration has downsized US science by historic margins — but it's not just via grant or workforce cuts. Our new @nature analysis reveals the government has
- 相关: Trump's
- 标签: x_platform, X @ylecun
- 📎 原文链接
⭐️⭐️ RT by @ylecun: These folks are trying to
These folks are trying to ban open source. They're looking to take away your freedom to choose. They're also looking to take away the rights of businesses like Cursor to fine tune and make their product faster and cheape
- 相关: RT, These, They're, They're, Cursor
- 标签: x_platform, X @ylecun
- 📎 原文链接
⭐️⭐️ DeepMind扩AI教育项目
Google DeepMind表示,其AI教育项目今年将扩展至拉丁美洲。该项目获得Google.org提供的460万美元资金支持,目标是在2028年前培训2.4万名教育工作者,并覆盖125万名学生。此举显示大型科技公司正加大对AI素养教育的投入,尤其关注新兴地区的教师培训和学生触达。
- 相关: Google DeepMind, Google.org, 拉丁美洲
- 标签: AI教育, 教师培训, 拉丁美洲
- 📎 原文链接
⭐️⭐️ R to @GoogleDeepMind: The system uses li
The system uses live video and audio to process physical symptoms in real-time. This means it could analyze a patient's walk, listen to their breathing, or look at how a rash is appearing. Alongside physicians from @Harv
- 相关: R, @GoogleDeepMind, The, This, Alongside
- 标签: x_platform, X @GoogleDeepMind
- 📎 原文链接
⭐️⭐️ DeepMind推AI协诊研究
Google DeepMind发布AI co-clinician研究进展,探索多模态智能体如何支持医护人员和患者。该系统目标是以高质量证据辅助医疗决策,并在测试中适配NOHARM安全框架。DeepMind称,在98个初级保健查询中,系统有97个未出现关键错误,并在盲评中优于可比系统。这表明AI医疗助手在安全性评估和临床决策支持方面取得阶段性进展。
- 相关: Google DeepMind, AI co-clinician, NOHARM, 多模态智能体
- 标签: 医疗AI, 临床决策支持, AI安全
- 📎 原文链接
⭐️⭐️ R to @GoogleDeepMind: In testing, AI co-
In testing, AI co-clinician matched or outperformed physicians in 68 out of 140 assessed areas, including triage. Yet humans were easily better at spotting crucial red flags and guiding physical exams - showing how these
- 相关: R, @GoogleDeepMind, In, AI, Yet
- 标签: x_platform, X @GoogleDeepMind
- 📎 原文链接
⭐️⭐️ DeepMind展示AI临床助手
Google DeepMind展示了一款多模态AI“协作临床医生”系统,可通过实时视频和音频分析患者步态、呼吸、皮疹等体征。该系统与哈佛医学院、斯坦福医学院医生合作,在包含20个场景和“患者演员”的模拟研究中进行测试。结果显示,AI在140个评估领域中的68项达到或超过医生表现,包括分诊;但医生在识别关键危险信号和指导体格检查方面仍明显更强。为保障患者安全,系统采用双智能体架构,由“Planner”持续监控“Talker”是否保持在安全临床边界内。
- 相关: Google DeepMind, 哈佛医学院, 斯坦福医学院, AI临床助手, 多模态AI
- 标签: 医疗AI, 多模态, 临床诊断, AI安全
- 📎 原文链接
⭐️⭐️ DeepMind扩展医疗测试
Google DeepMind 表示正与全球学术界和机构推进相关医疗研究,并将逐步扩大面向临床医生的可信测试者计划。该计划将扩展至更多站点,以收集不同地区医护人员和患者的反馈。此举有助于其在医疗 AI 落地前更系统地理解临床使用需求和潜在影响。
- 相关: Google DeepMind, 医疗 AI, 临床医生
- 标签: 医疗AI, 可信测试, 临床应用
- 📎 原文链接
⭐️⭐️ Anthropic研究Claude求助场景
Anthropic分析了100万段Claude对话,以了解用户如何向Claude寻求个人指导、常见提问类型、模型回应方式以及何时会出现迎合用户的“谄媚”倾向。研究结果被用于改进Opus 4.7和Mythos Preview的训练,形成从社会影响观察到模型训练优化的反馈闭环。Anthropic称该研究的数据收集与分析使用了其隐私保护工具,以降低用户数据处理风险。
- 相关: Anthropic, Claude, Opus 4.7, Mythos Preview, Clio
- 标签: 模型安全, 用户研究, 隐私保护, 模型训练
- 📎 原文链接
⭐️⭐️ R to @AnthropicAI: This work is part of
This work is part of a loop we're working to close between societal impacts and model training. One of our goals is to study how people use Claude, find where it falls short of its principles, and use what we learned in
- 相关: R, @AnthropicAI, This, One, Claude
- 标签: x_platform, X @AnthropicAI
- 📎 原文链接
⭐️⭐️ R to @AnthropicAI: All data in this stud
All data in this study was collected and analyzed using our privacy-preserving tool. Read more: anthropic.com/research/clio
- 相关: R, @AnthropicAI, All, Read
- 标签: x_platform, X @AnthropicAI
- 📎 原文链接
⭐️⭐️ It's never been easier to do everyday wo
It's never been easier to do everyday work with Codex. Choose your role, connect the apps you use every day, and try suggested prompts. Codex helps with everything from research and planning to docs, slides, spreadsheets
- 相关: It's, Codex., Choose, Codex
- 标签: x_platform, X @OpenAI
- 📎 原文链接
⭐️⭐️ R to @OpenAI: As Codex works, you can se
As Codex works, you can see what’s happening at a glance, including task progress, the files and tools it used, and what comes next. Video
- 相关: R, @OpenAI, As, Codex
- 标签: x_platform, X @OpenAI
- 📎 原文链接
⭐️⭐️ OpenAI推广Codex助手
OpenAI在X上介绍了Codex面向日常办公的新能力,用户可选择自身角色、连接常用应用并使用推荐提示词。Codex可汇总不同应用和文档中的数据,规划下一步、起草内容、整理研究或生成项目计划。设置过程中,Codex会按角色推荐插件,并引导连接Slack、Google Workspace、Microsoft 365等工具。该更新显示OpenAI正将Codex从编程场景扩展到更广泛的知识工作流程。
- 相关: OpenAI, Codex, Slack, Google Workspace, Microsoft 365
- 标签: AI助手, 办公自动化, 应用集成
- 📎 原文链接
⭐️⭐️ R to @OpenAI: During setup, Codex recomm
During setup, Codex recommends useful plugins for your role and guides you through connecting apps like @SlackHQ , @GoogleWorkspace , @Microsoft365 , and more. Video
- 相关: R, @OpenAI, During, Codex, @SlackHQ
- 标签: x_platform, X @OpenAI
- 📎 原文链接
⭐️⭐️ R to @OpenAI: From draft to deck, review
From draft to deck, review the work as it takes shape inside Codex. Open the file, ask for changes, and keep tweaking it in the same thread. Video
- 相关: R, @OpenAI, From, Codex., Open
- 标签: x_platform, X @OpenAI
- 📎 原文链接
⭐️⭐️ OpenAI展示Codex工作流
OpenAI 在 X 上展示了 Codex 面向工作的使用方式,并附上了 Codex for Work 页面链接。根据介绍,用户可以在 Codex 执行任务时查看任务进度、使用过的文件和工具,以及下一步计划。用户还可以在同一对话线程中打开生成文件、提出修改并持续调整,例如从草稿完善到演示文稿。这表明 OpenAI 正在强化 Codex 在办公与协作场景中的可视化和迭代能力。
- 相关: OpenAI, Codex, ChatGPT
- 标签: AI编程, 办公自动化, 产品更新
- 📎 原文链接
⭐️⭐️ RT by @ylecun: I think the expression is
I think the expression is “pulling the ladder”! All labs trained their models by distilling (at the very least distilling the web) which allowed them to become the fastest growing businesses in the history of humanity an
- 相关: RT, I, All
- 标签: x_platform, X @ylecun
- 📎 原文链接
⭐️⭐️ 开源模型监管争议升温
Yann LeCun 转发多条 X 帖文,围绕“蒸馏攻击”与开源模型监管展开激烈讨论。Dan Jeffries 和 Clement Delangue 认为,将蒸馏定义为攻击可能被用于限制开源模型、企业微调权利以及中国模型在美国的使用。相关帖文还将此与 NVIDIA 在中国市场受限、国产芯片生态崛起联系起来,并以“西方 10 亿用户 vs 其他 60 亿用户”的表述强调潜在全球竞争影响。争议核心在于:AI 安全与国家安全监管是否会演变为对开源生态和市场选择的限制。
- 相关: Yann LeCun, Dan Jeffries, Clement Delangue, OpenAI, Anthropic, Google, NVIDIA, Cursor
- 标签: 开源模型, AI监管, 模型蒸馏, 中美AI竞争
- 📎 原文链接
⭐️⭐️ DeepMind倡议AI数据盘点
Google DeepMind 转发介绍其面向核聚变等清洁能源研究的“AI Data Stocktake”倡议。该团队正与领域专家沟通,梳理 AI 在核聚变研究中的机会、数据障碍,并提出加速进展的建议。DeepMind 表示,这类数据盘点方法可作为政策制定者、科研资助方和产业界在其他科学领域应用 AI 的参考框架。
- 相关: Google DeepMind, Pushmeet Kohli, AI Data Stocktake, 核聚变
- 标签: AI for Science, 清洁能源, 核聚变, 科研数据
- 📎 原文链接
⭐️⭐️ R to @GoogleDeepMind: Things to keep in
Things to keep in mind: ✅ Base your creations around the numbers 1-10 ✅ Use Canvas in @GeminiApp or @GoogleAIStudio Submit by May 6 → goo.gle/4eNsr15
- 相关: R, @GoogleDeepMind, Things, Base, Use
- 标签: x_platform, X @GoogleDeepMind
- 📎 原文链接
⭐️⭐️ One week since the launch of GPT-5.5, an
One week since the launch of GPT-5.5, and it’s already our strongest model launch yet. API revenue is growing more than 2x faster than any prior release, while Codex doubled revenue in under seven days as enterprise dema
- 相关: One, GPT-5.5, API, Codex
- 标签: x_platform, X @OpenAI
- 📎 原文链接
⭐️⭐️ Bring your workflow to Codex in just a f
Bring your workflow to Codex in just a few clicks. Import settings, plugins, agents, project configuration, and more so you can keep working with fewer interruptions. Your move. Video
- 相关: Bring, Codex, Import, Your
- 标签: x_platform, X @OpenAI
- 📎 原文链接
⭐️ 世界模型概念溯源
Jitendra Malik 在 X 上指出,“世界模型”并非新造概念,而是在技术上对应 MDP 与控制理论中的转移模型/动力学模型。其历史可追溯到约 1960 年 Bellman、Kalman 相关工作中的状态空间方法。他同时分享了一场相关历史脉络的演讲,帮助澄清当前 AI 语境中该术语的来源。
- 相关: Jitendra Malik, Yann LeCun, Bellman, Kalman, MDP, 控制理论, 世界模型
- 标签: 世界模型, 控制理论, AI术语
- 📎 原文链接
⭐️ DeepMind征集Gemini创意
Google DeepMind 在 X 上发起 Google I/O 相关征集,邀请开发者展示使用 Gemini App 或 Google AI Studio 构建的创意项目。入选作品有机会在 Google I/O 主舞台相关展示中获得曝光。官方给出的方向包括蛋白质模拟器、物理引擎和数学艺术等,体现其推动 Gemini 工具进入创意编程与科学计算场景的意图。
- 相关: Google DeepMind, Gemini App, Google AI Studio, Google I/O
- 标签: Gemini, 开发者活动, Google I/O
- 📎 原文链接
⭐️ OpenAI征集Codex宠物
OpenAI Developers在X平台发起互动活动,邀请用户使用“/hatch”创建并展示自己的Codex宠物。活动将选出10个最受喜爱的作品,获奖者可获得30天ChatGPT Pro。该活动主要用于开发者社区互动和Codex相关产品传播。
- 相关: OpenAI, OpenAI Developers, ChatGPT Pro, Codex
- 标签: 开发者社区, ChatGPT Pro, Codex
- 📎 原文链接