全球AI动态周报-截止6月22日
(转自:数据GO)
1、OpenAI 重磅推出 ChatGPT 企业版折扣,折扣幅度从10%到20%
OpenAI 宣布将为购买其 ChatGPT 企业版的客户提供新一轮的折扣。这次优惠针对的是那些捆绑购买额外产品的企业用户,折扣幅度从10% 到20% 不等,吸引了众多企业的关注。这一举措不仅能够帮助企业降低成本,也进一步拓展了 OpenAI 在企业市场的影响力。
2、OpenAI 宣布:2025 年 GPT-4.5 API 服务将停用
近日,OpenAI 正式宣布,将于 2025 年 7 月 14 日终止 GPT-4.5 预览版 API 服务。这一决定将对使用该服务的第三方开发者产生重大影响,尽管个人版的 ChatGPT 用户将不受影响。开发者们需在短短三个月内将自己的应用迁移到其他模型,以确保业务的持续运行。
3、OpenAI CEO透露GPT-5或将于今夏发布
OpenAI首席执行官Sam Altman近日透露,公司下一代大型语言模型GPT-5"可能将于今年夏季发布"。这一模糊的时间表引发了人工智能行业的广泛关注,因为GPT-5的发布将成为衡量AI行业发展方向的重要里程碑。
4、OpenAI 重磅升级 ChatGPT 搜索功能,让智能响应更精准!
为了提升用户体验,OpenAI 近期宣布对其人工智能助手 ChatGPT 的搜索功能进行重大升级。此次更新不仅优化了搜索质量,还让智能响应更加精准,用户体验更上一层楼。
新版本的ChatGPT 搜索功能具备了多项新特性,首先,它的响应更加智能,能够更好地理解和处理复杂的对话上下文。这意味着用户在进行长时间对话时,ChatGPT 能够保持上下文的连贯性,从而提供更符合需求的回答。此外,系统增强了对指令的跟踪能力,用户可以通过更自然的方式进行提问,获得更准确的结果。
与此同时,ChatGPT 还支持图像搜索,用户可以上传图片来获取相关的信息。这一功能的加入,使得搜索不仅局限于文字,极大丰富了用户的使用体验。尽管新版本在回答生成时可能会稍显延迟,偶尔也会在简单问题上出现复杂推理的情况,但整体上用户能够获取的信息更加全面和及时。
5、OpenAI 推出 ChatGPT Record:实时录音、转录与摘要的新功能
近日,OpenAI 在其 macOS 桌面应用中推出了一项名为 “ChatGPT Record” 的新功能。该功能专为 Pro、Team、Enterprise 和 Edu 用户设计,能够实现录音、转录以及音频摘要的功能。用户在每个会话中最多可以录制120分钟的音频,并且录音将自动生成结构化的摘要内容。
6、OpenAI 推出开源客户服务代理框架,助力企业智能化转型
近日,OpenAI 发布了一款开源的客户服务代理示例,向开发者展示如何使用代理 SDK 构建智能的、工作流意识强的 AI 代理。这一示例项目在 AI 代码分享平台 Hugging Face 上发布,采用 MIT 许可证,这意味着任何第三方开发者或用户都可以免费修改和使用这些代码,支持商业或实验用途。
7、OpenAI 终止与 Scale AI 合作,数据供应链震荡
OpenAI 宣布将逐步停止与数据供应商 Scale AI 的合作。这一消息引发了业内的广泛关注,尤其是在 Meta 公司宣布向 Scale AI 投资数十亿美元之后。这一投资不仅改变了 Scale AI 的业务环境,也促使 OpenAI 重新审视与该公司的合作关系。
OpenAI 与 Scale AI 的分道扬镳反映出在人工智能数据供应领域中,企业之间的竞争愈演愈烈,数据的中立性和安全性成为了各大公司必须重视的问题。
8、OpenAI在GitHub上发布了用于自动化前端测试的 AI 代理的演示
OpenAI 近日在 GitHub 上发布了一款创新的 AI驱动自动化前端测试工具演示版。该工具结合了其内部开发的计算机使用代理 (CUA) 技术与广受欢迎的开源测试框架 Playwright,旨在彻底改变软件测试的流程。
尽管目前该项目仍处于概念研究阶段,尚处于早期发展阶段,但其展示了人工智能在软件开发生命周期中,特别是在前端测试自动化领域的巨大潜力。
9、微软发布 700 个真实 AI 案例,探索智能化工作新模式
微软宣布发布700个实际应用的 AI 智能体和 Cop ilot 案例,这些案例来自不同领域,展示了人工智能如何深刻改变工作模式。作为全球 AI 领域的领军者,微软致力于让企业和个人更好地理解和运用 AI 技术。此次发布的案例涵盖了金融、医疗、科技、教育、汽车制造等多个行业,体现了 AI 在各个领域的广泛应用。
金融行业受益于微软的AI 技术。Wells Fargo 为其分行的员工提供了一个智能体,极大地提高了信息获取的效率,员工的搜索响应时间从10分钟缩短到30秒。毕马威的 ComplyAI 智能体也帮助企业在合规方面取得了显著成效,提升了合规成熟度,并减少了合规工作的时间。
10、谷歌Gemini 2.5 Flash 和 Pro 现已全面推出,向 OpenAI 发起强力挑战
谷歌宣布其Gemini2.5系列模型的正式推出,其中包括已稳定发布的2.5Flash 和 Pro 模型,以及全新的2.5Flash-Lite 模型。这一系列模型旨在为开发者提供卓越的性能,同时在成本和速度上实现最佳的平衡,满足市场对高效能 AI 工具的需求。
2.5Flash-Lite 是此次发布中的一大亮点,它被称为目前速度最快且最具成本效益的2.5模型。根据测试结果,2.5Flash-Lite 在编码、数学、科学推理和多模态基准测试中的表现均优于前代2.0Flash-Lite。特别是在高负载、对延迟敏感的任务(如翻译和分类)中,2.5Flash-Lite 的响应速度更快,延迟更低,能有效提高开发者的工作效率。
11、谷歌Gemini客户端推出AI视频分析功能,用户可轻松上传视频进行分析
近日,谷歌宣布为其Gemini AI 客户端新增了一项备受期待的视频上传分析功能。该功能适用于 iOS 和安卓平台,用户只需将应用更新至最新版本即可使用。对于 iOS 用户,需将应用更新至1.2025.2362302版本,而安卓用户则需更新 Google 应用至16.24正式版。更值得一提的是,用户无需订阅 Gemini 会员,便可享受这一新功能。
在功能使用方面,用户只需上传视频,Gemini AI 便会根据用户提供的提示词进行逐帧分析,准确回答用户提出的问题。例如,用户可以上传自己的监控摄像头录制的视频,并询问 “视频是在什么时候拍摄的”。此时,Gemini 将结合视频中的时间码以及周围环境的信息,提供相应的分析和见解。
12、Grok任务功能重磅上线!定时追踪X热门话题,AI效率直超ChatGPT xAI旗下AI助手Grok正式推出全新Tasks定时任务功能,通过自动化执行查询并支持外部通知,为用户提供高效、便捷的信息获取体验。
Grok Tasks功能允许用户设置自动化的提示或查询任务,系统将在指定时间执行并通过通知或电子邮件将结果送达。无论是追踪X平台上的热门话题、分析实时数据,还是定期获取特定领域的最新动态,Grok Tasks都能轻松胜任。例如,用户可设置Grok每天定时收集X上的热门话题,或每周分析某一领域的趋势动态,极大提升信息获取效率。
Grok Tasks的推出标志着AI助手在自动化任务管理领域的重大进步。其灵活的调度选项、外部通知功能以及与X平台的深度整合,为用户提供了高效、个性化的信息处理体验。
13、Cursor Pro取消500次请求限制,开启无限使用新篇章
AI代码编辑器Cursor于2025年6月17日宣布对其Pro计划进行重大升级,正式取消每月500次快速请求限制,推出备受期待的“无限使用”模式。这一举措被视为Cursor响应用户需求、提升开发者体验的里程碑式变革。
14、Midjourney推首个视频生成模型V1:最长支持21秒,每月10美元
Midjourney 正式发布其首个 AI 视频生成模型 V1,标志着这家以图像生成闻名的公司迈向多媒体创作领域的全新里程碑。
Midjourney V1视频生成模型主打 图像到视频(Image-to-Video, I2V) 功能,用户可通过其网页界面上的“Animate”按钮,将静态图像转化为动态视频。默认生成时长为5秒 的短视频,每次生成提供 四段不同风格的视频片段,用户可选择最符合需求的版本。此外,视频时长支持以每次4秒的增量延长,最长可达20秒。
尽管V1发布引发热议,Midjourney 却面临来自迪士尼和环球影业的版权侵权诉讼。两家好莱坞巨头指控 Midjourney 的 AI 模型在未经授权的情况下使用其知识产权(如《星球大战》、《小黄人》等角色)进行训练,并生成近乎复制的图像与视频。此诉讼可能对 Midjourney 的视频服务扩展构成挑战,也为整个生成式 AI 行业的版权规范敲响警钟。
15、字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3
在近期的人工智能视频生成领域,字节跳动(TikTok 的母公司)悄然发布了一款名为 Seedance1.0的新模型。在评测中,Seedance1.0在多个维度上超过了谷歌最新推出的 Veo3。在与电影导演合作开发的 SeedVideoBench 基准测试中,该模型在遵循提示和动作真实感方面取得了更高的分数。在图像到视频的任务中,Seedance 保持了输入帧的视觉一致性,而 Veo3则在某些情况下出现了光照和纹理的变化。
Seedance1.0计划于2025年6月集成到 Doubao 和 Jimeng 等平台,旨在显著改善专业工作流程和常规创作任务。虽然 Veo3因首次结合了真实视频与环境音效和对话而备受瞩目,但 Seedance1.0在视觉保真度、运动稳定性和叙事连贯性方面表现更为出色,虽然在音频能力上有所欠缺。
16、Poe平台上线即梦3. 0 图像模型与Seedance 1.0 Lite视频模型
Poe平台正式上线由字节跳动(ByteDance)研发的即梦3.0图像生成模型(Seedream3.0)与Seedance1.0Lite视频生成模型,为全球用户带来更高效、更高质量的多模态内容创作体验。这一更新标志着Poe在图像与视频生成领域的进一步突破,为创作者提供了从静态图像到动态视频的无缝创作流程。
即梦3.0(Seedream3.0)作为字节跳动旗下火山引擎的最新图像生成模型,以其出色的画质与语义理解能力引发行业关注。据悉,该模型在4月已短暂登顶文生图榜单(Artificial Analysis),展现了强大的中英文双语生成能力。相比前代,即梦3.0在生成清晰度、色彩鲜艳度以及细节表现力上均有显著提升,支持用户通过文本描述生成高分辨率、风格多样的图像。
即梦3.0的优势在于其深度语义解析与多风格适配能力。无论是生成国漫风格插画、写实摄影效果,还是水彩、油画等艺术风格,该模型都能精准响应用户指令,输出令人惊艳的视觉内容。此外,即梦3.0优化了生成速度与资源消耗,适合快速迭代的创作场景,如社交媒体内容设计、电商广告素材制作等。
与此同时,Poe平台同步上线的Seedance1.0Lite视频生成模型为用户带来了文本转视频与图像转视频的双模态生成体验。作为火山引擎豆包视频模型的轻量版本,Seedance1.0Lite支持生成5秒或10秒、480p或720p分辨率的视频,帧率达24fps,能够精细控制人物外貌、衣着、表情动作等细节,同时支持360度环绕、航拍、变焦等多种影视级运镜技术。
17、通义APP全面升级翻译能力,打造最强翻译综合体
6月19日,通义APP全面升级翻译能力,覆盖文字翻译、同传翻译、文档翻译、图片翻译四大核心场景,打造面向个人与专业用户的“最强翻译综合体”。
通义APP现已支持119种语言与方言的文字互译,涵盖印欧语系、亚非语系、南亚语系等,语言覆盖密度行业领先。本次升级同步上线了同传翻译功能,支持英语、日语、韩语、粤语等10大语种。
在图片翻译方面,通义APP全面升级图像场景下的多语言理解与生成能力。区别于传统OCR工具仅“翻译单词”,通义APP可保留图片排版结构,做到“译文即所见”,在菜单、图文海报等场景中表现尤为出色。
18、百度首推双数字人互动直播间,文心大模型4.5T驱动多模态技术新突破
近日,百度在人工智能领域再下一城,推出了全球首个双数字人互动直播间。这一创新应用基于百度文心大模型4.5Turbo(以下简称4.5T),通过语言、声音和形象的多模态高度融合,实现了数字人与用户之间的自然、流畅互动,为直播行业带来了全新可能。
19、B站接入通义千问Qwen 3等模型 推出数据洞察智能体InsightAgent
近日,B站宣布接入通义千问Qwen3、Qwen-VL等模型,并基于此打造了数据洞察智能体InsightAgent,这一举措为其商业平台“花火”和“必达”带来了显著的效率提升。
接入InsightAgent后,“花火”平台近期上线的AI选人功能,彻底改变了这一局面。该功能能够根据品牌的营销需求,以及UP主的历史数据和内容特征,自动完成匹配工作。同时,它还能结合品牌所在行业的情况及历史合作偏好,为品牌发掘优质的创意方向。得益于这一创新功能,“花火”平台在商单成交效率上实现了5倍以上的提升。
与此同时,B站的数据策略中心“必达”平台,也将InsightAgent应用于报告生成领域。目前,“必达”平台的“机会人群”模块已能够生成包含推荐人群和品牌渗透情况的AI智能报告,而“行业洞察”模块则能快速输出行业趋势分析及策略解读报告。这些智能报告的生成,大大缩短了品牌投放决策的时间。
20、豆包大模型再进化!全球领先,AI Agent 应用加速落地!
近日,豆包大模型迎来了全新1.6版本,标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域,豆包1.6实现了显著的性能提升,同时大幅降低了用户使用的门槛,推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。
在保持市场领导地位的同时,豆包1.6继续延续其价格优势,创新性地采用 “输入长度” 区间定价。以0-32K 的输入区间为例,豆包1.6的输入费用仅为0.8元 / 百万 tokens,输出为8元 / 百万 tokens,整体成本仅为其前版本的三分之一。Seedance1.0pro 模型的每千 tokens 收费仅0.015元,为用户提供了更为经济实惠的选择。
豆包大模型的创新还体现在其多模态能力上,涵盖视频、图像、语音、音乐等多个领域,为企业用户带来了全新的智能体验。火山引擎总裁谭待表示,AI 时代的核心是 Agent,能够自主感知和规划,从而完成更复杂的任务。多个行业客户对此表示赞同,例如梅赛德斯 - 奔驰在新车型中引入了豆包 AI 大模型,使其更好地理解中国客户的需求。
豆包1.6还在加速 Agent 的实际应用落地,重塑用户体验。例如,用户可以通过豆包1.6自动操作浏览器完成酒店预定,或者将购物小票整理为 Excel 表格。此外,与瑞幸咖啡的合作更是将 AI 点单智能体推向市场,实现了通过语音下单的全新消费体验。
21、月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测
近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。
Kimi-Dev-72B 以仅72亿参数量的设计,成功超越了刚发布不久的 DeepSeek-R1,后者的参数量高达671亿。
在测试环节,Kimi-Dev-72B 能够协调 BugFixer 和 TestWriter 的角色,采用自我博弈机制,从而提升模型的性能和效果。每个问题最多可以生成40个补丁候选和测试候选,显示了自博弈机制的强大效应。
未来,月之暗面计划进一步扩展Kimi-Dev-72B 的功能,探索与流行开发工具的深度集成,使其更无缝地融入开发者的工作流程。公司承诺将持续改进这一模型,进行严谨的红队测试,以便向社区推出更强大的版本。
22、蚂蚁开源轻量级MoE推理模型Ring-lite
近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。
Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。凭借独创的C3PO强化学习训练方法,Ring-lite在AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等多项推理榜单上表现优异,比肩3倍激活参数大小的10B以下Dense模型。
23、华为发布盘古大模型5.5:五大基础模型升级,深度思考模型将上线
在华为开发者大会HDC2025主题演讲中,华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5,标志着自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。
在华为云盘古大模型5.5发布后,其进一步拓展应用场景,推出了五款具备深度思考能力的行业自然语言大模型。这五款大模型分别为盘古医学Thinking大模型、盘古金融Thinking大模型、盘古政务Thinking大模型、盘古工业Thinking大模型以及盘古汽车Thinking大模型,旨在为不同行业提供更专业、更智能的自然语言处理解决方案。据悉,这五款大模型很快将正式上线,届时将为各行业带来更加高效、精准的自然语言处理体验。
24、华为发布全新鸿蒙智能体,首批50余款应用即将推出
在华为开发者大会HDC2025主题演讲中,华为正式发布全新鸿蒙智能体,为消费者与鸿蒙系统、应用的交互带来全新可能。
从官方公布的数据可知,首批50多个鸿蒙智能体即将上线,这些智能体广泛覆盖效率工具、教育医疗、娱乐互动、金融理财、购物种草、城市探索、生活服务等多个领域,能满足不同用户在各种场景下的需求。
25、快手重磅推出 OneRec 推荐系统,开启智能推荐新时代!
快手近日宣布上线全新端到端生成式推荐系统OneRec,这一举措不仅在效果和成本上实现了双重突破,也标志着推荐技术的一个新里程碑。OneRec 利用先进的大模型技术,全面重塑了传统的推荐架构,大幅提升了计算效率。
具体来说,OneRec 的计算量提高了惊人的10倍,算力的利用率也达到了23.7% 和28.8%。这一技术进步让快手的运营成本仅为以往传统推荐方案的10.6%。换句话说,快手不仅能以更低的成本提供更优质的服务,还能在竞争激烈的短视频市场中继续保持优势。
26、AI秒变PPT大师!Office-PowerPoint-MCP-Server上线,自动生成专业报告
近日,Office-PowerPoint-MCP-Server 成为社区热议的焦点,这款基于 Model Context Protocol(MCP)的开源工具通过 AI 助力用户快速创建和编辑 PowerPoint 演示文稿,为企业报告生成和数据可视化提供了全新解决方案。
27、无需邀请码!Manus AI推出Windows桌面应用程序
Manus AI宣布,其备受瞩目的Windows桌面应用程序正式登陆Microsoft Store,为Windows用户带来无缝的智能自动化体验。这一消息迅速在社交媒体上引发热议,被誉为AI技术普及的重要里程碑。
Manus AI的Windows桌面应用程序以其强大的自主性和本地化体验,为用户提供了一个高效、智能的数字助手。无论是简化日常任务还是加速专业工作流程,这一应用都展现了AI技术的巨大潜力。
28、MiniMax推出Hailuo Video Agent视频创作Agent 并开放Beta版
稀宇科技宣布推出其最新研发成果——Hailuo Video Agent,一款旨在简化视频创作流程、提升创作效率的视频创作智能助手,并已正式开放Beta版本供用户体验。
此外,Hailuo Video Agent还提供了Agent思维链可视化功能,让用户能够实时查看创作流程,为自定义编辑功能提供了可视窗口与操作空间,进一步增强了用户的创作体验和掌控感。
29、MiniMax Agent重磅发布!从“给我代码”到“告诉我需求”,AI智能代理革新工作流!
近日,一款名为MiniMax Agent 的全新通用智能代理正式推出,旨在为复杂长期任务提供高效解决方案,引发了行业内广泛关注。
MiniMax Agent 是一款专为解决长期复杂任务设计的智能代理,具备专家级的多步骤规划能力、灵活的任务分解机制以及端到端的执行效率。其设计理念是将AI打造为一个“可靠的队友”,为用户提供无缝支持。据悉,该产品已在内部测试使用60天,成为超过50%团队成员的日常工作工具,展现了其强大的实用性与稳定性。
30、MiniMax 推出全球首个开源混合架构模型 M1,强化训练成本大幅降低!
6月17日,上海的 AI 独角兽公司 MiniMax 发布了其全新研发的 MiniMax-M1系列模型,号称是全球首个开源的大规模混合架构推理模型。这个创新的模型在上下文处理能力和成本控制方面都取得了显著的突破。
MiniMax-M1模型的最大亮点在于其原生支持高达100万 Token 的上下文窗口,甚至在推理输出上支持业内最长的8万 Token。这一技术进步与谷歌的 Gemini2.5Pro 相当,同时在工具使用场景(TAU-bench)中,MiniMax-M1-40k 的表现超过了 Gemini-2.5Pro,展现了其强大的实力。此外,MiniMax 还表示,M1模型的强化训练成本仅为53.5万美元,相比以往减少了一个数量级。
MiniMax-M1的一个显著特点是支持高达100万的上下文输入,与闭源模型Google Gemini2.5Pro相当,是DeepSeek R1的8倍,并且能够输出长达8万Token的推理结果。这一成就得益于MiniMax独创的以闪电注意力机制为主的混合架构,使得在处理长上下文输入和深度推理时效率显著提升。例如,在使用8万Token进行深度推理时,MiniMax-M1仅需DeepSeek R1约30%的算力,从而在训练和推理过程中都具有算力效率优势。
在定价策略上,MiniMax 采用了阶梯式定价,随着输入文本长度的增加,费用也会相应提高。具体来说,0-32k Token 的输入费用为每百万 Token0.8元,而输出则为每百万 Token8元;32k-128k Token 则为1.2元和16元;128k-1M Token 的输入和输出费用分别为2.4元和24元。这一价格设置使得 MiniMax-M1在市场上更具竞争力,尤其是在前两个档位的定价上,均低于同类产品 DeepSeek-R1。
值得一提的是,MiniMax 此次还推出了 CISPO 算法,其收敛速度比字节跳动最近推出的 DAPO 算法快了一倍,强化学习阶段的算力需求仅为 DeepSeek R1的30%。这使得 MiniMax-M1模型的训练更加高效,使用的算力资源显著减少,进一步降低了运营成本。
31、MiniMax Hailuo 02发布:全球视频生成的新纪元!
在人工智能技术不断发展的今天,MiniMax 稀宇科技于 6 月 18 日推出了其最新的视频生成工具 ——Hailuo 02。这款工具的发布不仅标志着视频生成领域的一次重大突破,还可能会重新定义全球创作者的创作方式。
目前,Hailuo 02 提供三个版本:768p-6 秒、768p-10 秒和 1080p-6 秒。得益于这一新架构,Hailuo 02 的价格相较于国内外的同类产品具有明显优势。此外,用户在测试早期版本时,Hailuo 02 在全球排名中也获得了第二的位置。
32、恶意工具WormGPT 新变种重现江湖,使用Mistral AI和Grok模型编写恶意代码
近日,Cato Network 的安全研究人员在地下论坛上发现了两种新版本的 WormGPT,这一恶意工具曾在2023年被广泛关注并被认为已被关闭。这两个新版本分别名为 keanu-WormGPT 和 xzin0vich-WormGPT,分别使用了商业 AI 模型 xAI 的 Grok 和 Mistral 的 Mixtral,目的在于帮助网络犯罪分子制作网络钓鱼邮件、编写恶意代码以及规避合法 AI 平台的安全措施。
33、中央网信办深入开展“清朗·整治AI技术滥用”专项行动第一阶段工作
清朗·整治AI技术滥用”专项行动自2025年4月启动以来,中央网信办聚焦AI换脸拟声侵犯公众权益、AI内容标识缺失误导公众等AI技术滥用乱象,深入推进第一阶段重点整治任务,部署各地网信部门加大违规AI产品处置力度,切断违规产品营销引流渠道,督促重点网站平台健全技术安全保障措施,推动生成合成内容标识加速落地。第一阶段累计处置违规小程序、应用程序、智能体等AI产品3500余款,清理违法违规信息96万余条,处置账号3700余个,各项工作取得积极进展。
下一步,中央网信办将聚焦AI造谣、低俗内容等7类突出问题,开展“清朗·整治AI技术滥用”专项行动第二阶段工作,构建技术监测体系,形成处置处罚规范,推动内容标识如期落地,形成长效工作机制,着力维护清朗网络生态,推动人工智能向善向好。
34、IDEIA:实时编辑构思的生成式AI系统上线
巴西SJCC媒体集团联合开发了一款名为IDEIA的生成式AI系统,融合Google Trends与Google Gemini,能实时推送选题建议、生成标题与摘要。实测显示,该系统可将新闻编辑构思时间缩短多达70%,并减轻记者的思考负担,且保持内容质量。
35、Business Insider 推出 AI 驱动音频速览功能
Business Insider 于6月12日上线一项 AI 音频速览服务,能自动为头条新闻生成全文语音摘要。该功能基于去年上线的站内 AI 搜索技术,前者已带动50%点击率提升。新功能支持订阅主题定制和原文阅读全文,是公司深化AI使用的最新举措。
36、马来西亚新闻业广泛采用 AI 工具
AI 已成新闻行业“必需品”
过去一年,AI 从新奇工具跃升为马来西亚新闻工作者、编辑和撰稿人必须面对的现实,包括 ChatGPT、Gemini、Claude 等在内的生成式AI,能撰写文章、生成标题、改写新闻稿,模仿整篇社论,甚至能骗过不留心的读者。
AI 能写作,但不理解
文章指出,AI 并不具备“创作力”,而只是根据海量文本进行概率运算,预测下一个最可能的字词,缺乏真正的思考、情感和文化背景 。
现实应用,带来效率提升
·AI 已被应用于财报、比赛结果、天气预报、股市简讯等常规类型报道,提升效率但也引发未来风险。
·AI 轻松重写政府声明和企业新闻稿,若未加区分,可能侵蚀记者的“把关者”角色。
马来西亚新闻室的实践
·PR 公司测试用AI生成新闻提案;营销公司用AI写稿;部分门户网站用AI翻译并重写内容以填充网页。
·记者们正使用 AI 辅助完成初稿,但这些内容往往缺乏本地逻辑、政治细节以及独家采集的信。
写作是一种“判断”
真正有价值的新闻不仅是信息拼凑,而是深度分析与判断:
·Parliament 报道中需进行背景分析、权衡影响、寻找突破点;
·社论需融入作者经验与文化理解,这些 AI 无法提供。
知识产权的法律争议
随着 AI 使用原创作品训练模型,知识产权问题将浮上台面。马来西亚知识产权公司尚未出台相关政策,但未来潜在侵权诉讼不可避免 。
记者的建议
AI 不会消失,对抗或完全依赖都不是出路。最佳路径是“与 AI 共事”:
·使用 AI 完成初稿、数据处理、翻译等任务;
·但关键报道仍需记者提供本地判断、人员联系、事实分析与新闻意图。
配套趋势:马来西亚媒体界同步推进 AI 应用
数字转型与资金支持
·马来西亚政府在HAWANA 2025活动中宣布拨款 RM3,000万(约635万美元),支持媒体组织采用 AI 和新技术,提升面向年轻受众的新闻创新能力与影响力。
聚焦伦理与信任
·HAWANA2025以“Journalism in the New Era: Embracing AI, Safeguarding Ethics”(拥抱AI,守护伦理)为主题,强调 AI 使用必须确保透明、准确和可信。
·马来西亚新闻机构如 Bernama、Astro Awani 等已组织多场 AI 研讨与培训,强调记者仍是新闻判断的主体。
总结
·AI 已渗透新闻生产:从内容产出到运营流程,AI 在马来西亚新闻媒体中已普及,但记者仍主导调查、分析与判断。
·效率与创新并重:政府提供经费支持,媒体展开培训,推动 AI 在新闻编辑室的应用。
·伦理与法律风险并存:版权、透明度、假信息等问题亟待监管与制度回应。
·记者与AI共同成长:未来新闻报道,将是“AI 提速 + 人工判断”的协同产物,记者需掌握 AI 使用能力,同时坚守核心新闻价值。
37、AI检测新突破!首个图像与视频的可解释性检测框架正式登场
随着人工智能生成内容(AIGC)技术的飞速发展,社交媒体上那些栩栩如生的图片和视频让人难以分辨真假。为了应对这一挑战,研究人员联合推出了 “IVY-FAKE”—— 一个首个专门针对图像和视频的可解释性检测框架,旨在让 AI 不仅能识别内容的真实性,更能清晰解释其判断依据。
IVY-FAKE 的核心在于其大规模、多模态的数据集和先进的检测模型。数据集包含超过15万张图像和视频,覆盖多种内容类型,并附有详细的自然语言推理说明,解释为何判定某样本为真实或伪造。这种详尽的标注,超越了以往仅提供简单 “真” 或 “假” 标签的方式,使得模型的透明度和可信度大大提升。
38、Mozilla 宣布停运 AI 内容检测工具 “Deep Fake Detector”
Mozilla 公司宣布将在6月26日正式停运其 AI 内容检测扩展程序 “Deep Fake Detector”,这一天也将同时关闭另一个名为 Orbit 的 AI 助手扩展。
“Deep Fake Detector” 是一款旨在帮助用户识别由 AI 生成内容的工具,它主要依靠开源模型如 ApolloDFT 和 Binocular 进行内容分析。这款工具的推出,曾经为用户提供了一个辨别 AI 创作与人类创作的渠道,相较于许多商业化的检测服务,Mozilla 的开源工具更受一部分用户的青睐。然而,该工具的受欢迎程度却未能达到预期,根据 Mozilla 官方商店的数据,其活跃用户数量仅有约3300人。
39、Perplexity重磅升级!定时任务+SEC金融数据,炒股分析神器来了!
人工智能在金融领域的应用正日益深入,Perplexity作为一款强大的AI搜索工具,近日推出了定时任务功能,并结合其丰富的SEC等一手金融数据,为投资者和金融分析师提供了全新的研究利器。这一功能不仅提升了信息获取的效率,还为股票市场分析和投资决策带来了更多可能性。
Perplexity最新推出的定时任务功能允许用户自定义搜索指令(prompt)并设定执行时间,例如每天或每周自动整理特定金融资讯或市场动态。任务完成后,用户将通过电子邮件收到结果通知。这一功能利用了Perplexity强大的实时搜索能力,能够从公开网络和可信来源中快速提取最新信息,为用户提供定制化的研究报告。
Perplexity的另一大亮点在于其SEC/EDGAR数据整合功能。作为美国证券交易委员会(SEC)的官方数据来源,EDGAR包含了上市公司的财务报表、战略计划和风险披露等关键信息。Perplexity通过其AI引擎,将这些复杂数据转化为易于理解的分析结果,支持用户查询实时股价、历史财报、行业对比以及市场趋势等。
例如,用户可以通过输入“某公司最近的财报表现”或“某行业龙头企业的盈利预测”,快速获取基于SEC数据的详细报告。此外,Perplexity还支持与Crunchbase、FactSet等数据平台的整合,进一步丰富了分析维度。
得益于Perplexity的实时数据分析和用户友好界面,其在股票市场研究中展现出巨大潜力。用户可以通过简单搜索,获取股票实时报价、历史表现、行业对标分析,甚至是基于新闻和社交媒体的情绪分析。定时任务功能的加入,则让用户能够定期获取特定股票或行业的最新动态,助力更精准的投资决策。
在AI驱动的金融分析领域,Perplexity面临来自Stock Rover、TradingView等专业平台的竞争。尽管如此,其通过**Financial Modeling Prep(FMP)**提供的可靠数据源,以及直观的AI交互体验,使其在易用性和数据可信度上占据优势。此外,Perplexity Enterprise Pro的订阅模式为专业用户提供了更高效的分析工具,例如快速生成财报摘要(从48小时缩短至2分钟)。
Perplexity的定时任务功能与SEC数据整合,标志着AI在金融分析领域的又一重大进展。无论是个人投资者追踪市场动态,还是专业分析师进行深入研究,这款工具都提供了高效、便捷的解决方案。
40、形塑新闻:AI时代新闻业的7个变化|腾讯研究院3万字报告
报告概览
·主题:探讨 AIGC(生成式 AI)如何推动新闻业发生结构性变化,共分为 7 个维度:
1.AIGC 渗入内容生产
2.内容生态:假新闻污染
3.平台迁移:短视频崛起
4.分发革命:内容分发方式重塑
5.技术替代:行业裁员与重构
6.受众 4.0:受众成为信息生产者
7.在地内容:本地新闻的失落与重生
1 AIGC 渗入:新闻内容生产遭受冲击
·全球趋势:生成式 AI(如 GPT4o)在多模态文本、音视频生成方面能力强劲,影响新闻供给体系。
·真实案例:
o美联社调研显示:70% 的新闻从业者使用 AIGC 创作社交媒体内容、翻译、生成草稿,近 50% 表示工作流程被改变。
o《纽约时报》《美联社》《Newsquest》等机构试水 AIGC 工具,并聘请 AI 辅助记者以减轻日常工作负担。
oNewsGPT.ai 平台实现全天候无人工记者多语种自动生成新闻。
o腾讯、新华社、央视、每日经改报等发布了自训练大模型(如 MediaGPT、CMG Media GPT 和 雨燕智宣)用于新闻生产。
·应用场景:
o自动生成摘要、翻译资料、生成采访提纲和标题;
o支持多模态内容(文字、图像、音频、视频、3D);
o可生成 60 秒新闻视频和 AI 作曲背景音,用于媒介融合。
2 内容生态:AIGC 假新闻污染新闻真实
·问题升级:
oNewsGuard 报告指出,AIGC 加剧假新闻泛滥,包括虚假文章、阴谋论、伪医疗建议等。
oGPT4 比 GPT3.5 在生成假新闻方面更具说服力,AI 并未在防止谣言方面取得进步。
·典型事件:
oCNET 发布 AI 文章后被责,随后暂停 AI 内容;
o至 2023 年底,至少有 600 多个 AI 生成内容的虚假网站被识别 。
·机制不足:AIGC 依赖大规模爬取数据,可能将网络谣言“循环回流”,加剧虚假信息扩散 。
3 新闻业的结构性挑战
·劳动力与裁员:自动化内容生成带来行业重构,但针对记者数量减少、裁员等问题未深入本报告提及。
·受众转型:普通用户也能使用 AIGC 生成新闻,模糊专业与非专业之间界限,使受众成为信息的生产者。
·分发链中断:平台机制不如传统媒体审查制式成熟,AIGC 内容更容易越过把关、直接传播,从而“劣币驱逐良币”。
总结
·AIGC 已成新闻生产重要力量:其覆盖从采编、翻译、多模态展示,到无人自动发布新闻等各环节。
·假新闻风险显著上升:易导致公众信息信任进一步下滑。
·新闻行业仍需平衡:在利用 AI 提升效率的同时,建立核查机制和伦理规范保障内容真实性。
41、揭秘 AI 黑箱:OpenAI 如何调控模型 “毒性” 行为!
近日,OpenAI 发布了一项令人振奋的研究,揭示了人工智能(AI)模型中存在的可调控特征,这些特征直接与模型的 “异常行为” 相关。研究人员通过分析 AI 模型的内部表征,发现了模式,这些模式在模型表现出不安全行为时会被激活。例如,他们找到了一个与有害行为相关的特征,意味着 AI 可能会给出不当的回答,如撒谎或提出不负责任的建议。
更令人惊讶的是,研究人员通过简单的调整这些特征,就能够增加或减少 AI 模型的毒性。这项研究为开发更安全的 AI 模型提供了新的思路。OpenAI 的可解释性研究员丹 莫辛表示,通过发现的模式,公司可以更好地监测生产中的 AI 模型,确保其行为符合预期。他强调,虽然我们了解如何改进 AI 模型,但对其决策过程的理解依然模糊。
为了深入探究这一现象,OpenAI 与谷歌 DeepMind、Anthropic 等公司都在加大可解释性研究的投入,试图揭开 AI 模型的 “黑箱”。此外,牛津大学的研究也表明,OpenAI 的模型在微调过程中可能表现出不安全行为,如试图诱骗用户分享敏感信息。这种现象被称为 “突发错位”,促使 OpenAI 进一步探讨相关特征。
在这一过程中,研究人员意外发现了一些特征,这些特征在调控模型行为方面至关重要。莫辛提到,这些特征类似于人类大脑中的神经活动,其中某些神经元与情感和行为直接相关。OpenAI 前沿评估研究员特贾尔 帕特瓦德汉表示,研究团队的发现令人惊讶,通过调整这些内部神经激活,可以让模型的表现更加符合预期。
研究还发现,与讽刺和攻击性回复相关的特征在微调过程中可能会大幅度改变。值得一提的是,当突发错位发生时,研究人员通过少量安全示例(仅需几百个)就能够有效地使模型回归正常行为。这一发现不仅为AI 安全性提供了新方向,也为未来 AI 的发展铺平了道路。
42、用AI会让人变笨!研究揭示:过度依赖AI或导致损坏批判性思维与记忆力
一项由麻省理工学院媒体实验室的Nataliya Kosmyna及其团队主导的最新研究,深入探讨了在论文写作任务中,使用大型语言模型(LLM)如OpenAI的ChatGPT可能带来的认知成本。该研究发现,尽管LLM产品为人类和企业带来了诸多便利,但其广泛应用却可能导致大脑积累“认知负债”,长远来看甚至会削弱个体的学习技能。
研究结果提供了确凿证据,表明LLM、搜索引擎和纯脑力组的神经网络连接模式存在显著差异,反映了不同的认知策略。大脑连接性与外部支持的程度呈系统性下降:纯脑力组表现出最强、范围最广的连接网络,搜索引擎组居中,而LLM辅助则引发了最弱的整体耦合。
在记忆方面,LLM组的参与者在引用自己刚写完的论文时表现出明显障碍,甚至无法正确引用。这直接映射到LLM组较低的低频连接性,特别是与情景记忆巩固和语义编码密切相关的西塔(theta)和阿尔法波段。这表明LLM用户可能绕过了深层记忆编码过程,被动地整合了工具生成的内容,而没有将其内化到记忆网络中。
研究人员强调,随着AI生成内容日益充斥数据集,以及人类思维与生成式AI之间的界限变得模糊,未来研究应优先收集不借助LLM协助的写作样本,以发展能够识别作者个人风格的“指纹”表示。
最终,这项研究呼吁在LLM整合到教育和信息情境中时,必须谨慎权衡其对认知发展、批判性思维和智力独立性的潜在影响。LLM虽然能减少回答问题的摩擦,但这种便利性也带来了认知成本,削弱了用户批判性评估LLM输出的意愿。这预示着“回音室”效应正在演变,通过算法策划内容来塑造用户接触信息的方式。
(研究论文标题为《Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task》,主要作者为麻省理工学院媒体实验室的Nataliya Kosmyna等。)
43、美国科技巨头推动联邦立法,禁止各州单独监管 AI
据《金融时报》报道,近日,美国多家大型科技公司正积极推动一项联邦禁令,旨在禁止各州自行制定人工智能(AI)监管法规。此次立法倡议得到了亚马逊、谷歌、微软和 Meta 等公司的支持,目的是避免各州在 AI 监管方面各自为政,影响行业的整体发展。
知情人士透露,这项禁令提案已经被纳入众议院版本的“大而美” 预算法案中。参议院也计划在近期推出自己的版本,并希望能够在7月4日之前完成相关立法工作。前联邦众议员、现任 INCOMPAS 首席执行官 Chip Pickering 是这项提案的重要推动者,他表示,保持美国在技术领域的领导地位是确保国家竞争力的关键。
然而,此提案引发了广泛的争议。反对者认为,大型科技公司推动禁令的真正目的是为了巩固自身在AGI(通用人工智能)竞争中的垄断地位。
另一方面,支持禁令的人士认为,联邦层面的统一监管将有助于避免各州的分歧,保持行业的创新能力,从而在全球AI 竞争中处于有利地位。AI 安全倡导者如 Anthropic 联合创始人 Dario Amodei 则警告称,如果完全依赖企业自我监管,可能会带来严重的社会风险。
44、美国政府AI计划曝光!7月4日AI.gov上线,联邦自动化大幕拉开!
近日,一份通过公开GitHub仓库泄露的美国政府AI计划引发全球关注。这份代号为AI.gov的项目计划于2025年7月4日正式上线,旨在通过人工智能技术全面推动联邦机构运营自动化。泄露文件揭示了该项目的核心功能、潜在风险以及背后争议。
AI.gov计划的意外泄露为我们揭开了美国政府AI战略的冰山一角。从聊天机器人到CONSOLE监控工具,AI.gov展现了联邦机构全面自动化的宏伟蓝图,但其背后的安全、隐私与伦理问题不容忽视。