为了控制、引导超级智能对齐问题,OpenAI周三(5日)表示,组建了一支人工智能对齐团队Superalignment。同时该团队也是对OpenAI现有工作的补充,可提升ChatGPT等产品的安全性,在4年内解决超级智能对齐问题。
超级智能将是人类发明的最具影响力的技术之一,可以帮助我们解决世界上许多难题。但超级智能的巨大力量也可能非常危险,并导致人类失去控制权,甚至灭绝人类。虽然超级智能还很遥远,但OpenAI认为,10年之内就很有可能实现。
目前,OpenAI还没有一个明确的解决方案来引导或控制超级人工智能。当下可控制的人工智能技术,例如,根据人类反馈进行强化学习,依赖于人类监督的AI能力等。但人类无法可靠地监督,比我们聪明多的AI系统,因此,我们目前的对齐技术无法扩展到超级智能,需要新的科学技术突破。
(资料图片)
为了控制、引导超级智能对齐问题,OpenAI组建了一支由Ilya Sutskever(OpenAI联合创始人兼首席科学家)和Jan Leike领导的人工智能对齐团队——Superalignment。
同时该团队也是对OpenAI现有工作的补充,可提升ChatGPT等产品的安全性,包括非法滥用、经济破坏、虚假信息、偏见和歧视、数据隐私和其他可能出现的问题。
他们预测,超智能AI(即比人类更聪明的系统)可能在这个十年(2030年前)就会到来,人类将需要比目前更好的技术来控制超智能AI,因此需要在所谓的“一致性研究”方面取得突破,该研究的重点是确保人工智能对人类有益。
根据他们的说法,在微软(Microsoft)的支持下,OpenAI将拿出未来四年所获算力的20%用于解决AI失控的问题。此外,该公司正在组建一个新的团队来组织这项工作,称为超级一致性团队。
据悉,该团队的目标是创建一个“人类级别”的AI研究人员,然后通过大量的计算能力进行扩展。OpenAI表示,这意味着他们将使用人类反馈来训练AI系统,训练AI系统来辅助人类评估,然后最终训练AI系统进行实际的一致性研究。
建立一个大致达到人类水平的自动对齐系统。然后,可以使用大量算力来扩展工作,并调整超级智能。
1、开发可扩展的训练方法:为了针对人类难以评估的任务提供训练方法,可以通过人工智能系统来协助评估,其他人工智能系统(可扩展的监督)。此外,OpenAI希望了解和控制其模型,将监督应用到无法监督的任务(泛化)上。
2、验证生成的模型:为了验证系统的一致性,OpenAI将自动搜索有问题的行为(稳定性)和有问题的内部结构(自动可解释性)。
3、对整个对齐管道进行压力测试:可以通过故意训练未对准的模型,来测试整个安全流程,并确认技术检测到最差的未对准类型(对抗性测试)。
OpenAI预计,随着对超级智能对齐了解越来越多,研究重点将会发生重大变化,可能会增加全新的研究领域。
未来,会分享更多有关技术研究路线图的信息。
每日经济新闻综合OpenAI官网
每日经济新闻
关键词:
7年内超级AI将问世!OpenAI宣布:20%算力投入,4年内控制超级智能
鸱吻神兽(鸱吻)
融创中国上半年合同销售金额521.4亿元 同比降低53.78%-环球报道
霍达:“去风险化”或让欧洲错失历史机遇_当前报道
什么时候是购买天文摄影设备的最佳时机?|实时焦点
三年亏20亿 连连数字如何撑起150亿估值?
财鑫闻丨传统商超转型记:服装礼品店退场 餐饮美食店开张
环球最资讯丨美股开盘丨三大指数集体低开 Rivian涨近6%
贷款直播火出圈!监管摸底商业银行网络直播销售风险
天津西青区可提供九阳电压力锅维修服务地址在哪 天天实时
环球速读:达尔优wasd和方向键反了怎么办(达尔优键盘方向键和wasd反了)
韶关文旅亮相第十一届澳门国际旅游(产业)博览会_环球视讯
观察:全国总工会党组理论学习中心组召开专题研讨会
世界新动态:拓维信息7月5日加速下跌
长江三峡游轮今年上半年完成客运量为2019年同期122.56%
广州职工学历教育补助申领将开始 共有1200个名额_环球热文
二十不惑吃牛排飞机升舱哪一集(二十不惑坐头等舱吃牛扒是第几集)|今日快看
烧电充电宝破解教程图解_自制充电宝教程_当前头条
环球快报:兰州新区:铆足劲头忙施工 项目建设“加速跑”
来自本尊的认可?普尔INS转发与其打球很像的基诺内斯集锦 天天动态
滴水贷款逾期多久会起诉?会怎么样呢? 全球观天下
山东加强污染治理,“十四五”末基本消除重污染天气
lg(gt540)|精彩看点
世界聚焦:数独是什么意思_怎么理解数独
7月4日基金净值:广发中小盘精选混合A最新净值1.9172,跌0.21%
2023北京市东城区食育成果汇报会举行
最好的防晒服测评 18款知名防晒服大评测|聚看点
【时快讯】方程豹汽车首款车型定名豹5
个人借条范本图片 个人借条范本
河北新河县局(营销部)开展“讲好三个故事”育品牌活动