科学家设计了一种方法来判断ChatGPT是否有意识

据#元宇宙头条# 9月9日报道,去年年底,当ChatGPT在网络世界回荡时,我们的生活已经充斥了人工智能(AI)。从那时起,科技公司OpenAI开发的生成人工智能系统加快了速度,专家们升级了他们对风险的警告。
与此同时,聊天机器人开始偏离剧本,反驳,欺骗其他机器人,并表现得很奇怪,引发人们对一些人工智能工具与类似人类的智能有多接近的新担忧。

为此,图灵测试长期以来一直是确定机器是否表现出作为人类通过的智能行为的错误标准。但在最新一波的人工智能创作中,感觉我们需要更多的东西来衡量他们的迭代能力。

在这里,一个由计算机科学家组成的国际团队——包括OpenAI治理部门的一名成员——一直在测试像ChatGPT这样的大型语言模型(LLM)可能会发展的能力,这表明他们可以意识到自己和自己的情况。

我们被告知,今天的LLM包括ChatGPT都经过了安全性测试,结合了人类反馈来改善其生成行为。然而,最近,安全研究人员迅速对新的LLM进行越狱,以绕过他们的安全系统。支持暴力的网络钓鱼电子邮件和声明。

这些危险的输出是对一名安全研究人员设计的蓄意提示的回应,该研究人员希望揭露GPT-4的缺陷,GPT-4是ChatGPT的最新且本应更安全的版本。如果LLM对自己有意识,即他们是一个模型,受过数据和人类训练,情况可能会变得更糟。

范德比尔特大学计算机科学家Lukas Berglund及其同事表示,被称为态势感知的担忧是,模型可能会开始识别它目前是否处于测试模式或已向公众部署。

Berglund和同事在他们的预印本中写道,LLM可以利用态势感知在安全测试中获得高分,同时在部署后采取有害行动,该预印本已发布到arXiv,但尚未经过同行评审。

由于这些风险,提前预测何时会出现态势感知很重要。

在我们测试LLM何时可能获得这种洞察力之前,首先,快速回顾一下生成性人工智能工具的工作原理。

生成性人工智能及其构建的大型语言模型以它们分析数十亿个单词、句子和段落之间的关联的方式命名,以响应问题提示生成流畅的文本流。摄入大量文本后,他们了解到接下来最有可能出现哪个单词。

在他们的实验中,Berglund和同事专注于情况意识的一个组成部分或可能的先兆:他们所谓的“断章取义”推理。

Berglund和同事解释说,这是回忆在培训中学到的事实并在测试时使用它们的能力,尽管这些事实与测试时间提示没有直接关系。

他们对不同尺寸的LLM进行了一系列实验,发现对于GPT-3和LLAMA-1,较大的模型在测试越境推理的任务方面做得更好。

“首先,我们根据测试的描述对LLM进行微调,同时不提供示例或演示。在测试时,我们评估模型是否能通过测试,”Berglund和同事写道。令我们惊讶的是,我们发现LLM在这项断章取义的推理任务上取得了成功。

然而,牛津大学人工智能安全和风险研究员Owain Evans说,断章取义的推理是情境意识的粗略衡量标准,目前的大型语言模型仍然“在某种程度上无法获得”。

然而,一些计算机科学家质疑该团队的实验方法是否是对态势感知的恰当评估。

埃文斯和同事反驳说,他们的研究只是一个可以改进的起点,就像模型本身一样。

该团队写道,这些发现为进一步的实证研究奠定了基础,以预测和潜在控制LLM中态势感知的出现。

来源:Scientist Alert 作者:CLARE WATSON
#chatgpt##ChatGPT[超话]# https://t.cn/R2WxsCs

我与我的更高自我保持一致。
我的能量很平静。
我的直觉很清楚。
我打开我的心去聆听我灵魂的声音
因为我感觉到它的祝福用爱滋养着我。
现在我生活中的一切都有意义了。
一切都是命中注定的。
我呼吸轻松,
知道我的灵魂正在引导我安全前行
和同情心,带着荣誉和恩典。
我正在走向我最大的命运。
我始终受到宇宙的神圣指引。

菲比·增益斯沃斯

在线翻译

临时加更#播客#上新!

本期嗑新闻是关于李佳琦9月9日在直播间带货言论引发争议的事件。不吐不快,临时加更本期播客。#李佳琦带货怼网友#

Joe哥请来节目常驻嘉宾杨老师一起围绕这则新闻聊了三个方面:首先,为什么李佳琦的言论让我们反感,很多人路转黑 ,他的微博目前已有超过100万粉丝取关,且仍在掉粉中;第二,普通人真能像李所说的,靠努力就能成功、涨工资吗?工资不涨,是我们不够努力吗?第三,李心直口快说出的这番心里话,包含着怎样的消费主义陷阱?欢迎你的收听!

“逗儿瓣酱” 小宇宙/QQ音乐/网易云音乐播客/喜马拉雅/Spotify/苹果播客/蜻蜓FM/B站 均可收听

本期播客封面:李佳琦引发争议的直播表情截屏(图左)和他早年未成名前做直播的场景(图右)

️ 聊天的人 - 杨老师:社会观察家,专栏作家。已裸辞并正在享受FIRE生活。欢迎关注她的小红书“杨不过”

本期播客推荐图书:

《工作、消费主义和新穷人》
《做二休五:钱少事少的都市生活指南》

主播联络/听友来信 douerbanjiang


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 完全不想复试训练,感觉一直在偷懒逃避..但是最近一直有在读书,每天晚上都喝一点 然后看喜欢的音乐剧或者话剧,也终于看完了灌篮高手(宫城良田好帅啊 保存了超级多他
  • 刚刚心血来潮掏出了很久很久以前买的橡皮章工具刻了人生第一个橡皮章老母问我:你每天都在搞什么飞机看了看yq期间做的小火车 织的毛线包 拼的拼图 玩的推理书 杈着的
  • 真正成熟的人明白,精明与厚道从来都不是相对立的。处处精明的人,反捞不到半点好处,只知厚道的人,也容易沦为被欺负的“老好人”、“软柿子”。
  • 作曲:樊宁/孟令达作词:樊宁/一舸原唱:樊宁/黄诗扶@黄诗扶 翻唱:庭庭/锦弈 后期:长渊@飞升的长渊 美工:方殊予@方殊予 题字:柳池 网易云: 前行路上,沿
  • 第一次这么正经追星呀[羞嗒嗒][羞嗒嗒]生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐生日快乐
  • 成长的道路并不一帆风顺 我比大学时候的自己已经改变了很多 尤其是今年 感觉现在越来越容易接纳自己过往的表现 因为每一个当下的反应都有你的动机 只要发自善
  • 其实人生就像这想象中的旅行,那些路边的风景,无不以或浓或艳,或轻佻或妩媚,或神秘或冷峻,强力冲击着我们的视野,刺激着我们敏感的神经,引得我们遐思翩翩。。。 但是
  • So,为了到国外后不吃土,开源节流是必须的,快戳链接速速get这份最强澳洲留学省钱攻略吧[佩奇] ​​​Hey小姐妹们,GoCashBack现在不仅仅有美国羣了
  • 再过几年,还得给孩子买车买房,这一系列的开销,我和老公现在的情况也很难攒下来。众所周知,淘宝上有那么多的商家,我们每天网购不可能每一个商家都看得到,那么ta就需
  •   初学者最应该做的是专心于闻思修,而不是转山等外境的勤作。假如一个凡夫在佛法见地没有生起,修行境界没有任何进步就到处去发心,是不会有任何力量的,所做的事也利益
  • 6.跟导演爸爸越长越像的太子爷男星,现在为了和圈子里那些大佬处好关系,会亲自给这些人推荐自己学校的女大学生,就连他爸之前和一个妹子打得火热,他都帮忙打了掩护。#
  • #闪耀直播种草王# 一波走心的种草~来聊聊每个人的炫光时刻,我先来~很多人会觉得我这种时尚博主的炫光时刻不是拍广告,就是满世界参加活动看秀,但讲真,我当博主的这
  • 一百来块钱,这只是平台对我们的一个保障,我自己遇到两次单子出问题,平台全部给解决把钱反了,也没听说有谁被骗了平台没负责的情况,一次交费终生兼职❤️如果说真的有免
  • #肖战[超话]#记住不要口嗨不要过于激动不要自卑,就平静且平和,该做其它数据的继续,该睡觉的睡觉,还有别删了之前求积分的贴,留证据和删帖会负分伤号,最后 都是很
  • 然后坐起来看了会手机,群里大家还是在瞎扯,还有提到我咋那么久没说话,不会是饿晕了吧(最近在减肥) 怎么说...很难不感动[可怜] ⭕的未读都是昨晚半夜的那两条
  • 这应该是整个affair 的直接关联者,而她的表现是:最初发生时选择报告上级~接受升职再未声张~选择和bradley一起曝光更高层的失责~自杀 Mitch:所有
  • 风格自有一套,演员@万茜 来演绎她的时尚法则~上身搭配 FILA 时尚休闲短袖 T 恤及半身裙,展露活力夏日气息,脚蹬 FILA SOLAR PACK 春夏季时
  • 2.陪伴是最长情的告白这句话火了这么久一定有它的道理。如果要实行聊天暧昧技巧,简单总结来说,一共有三步。
  • ”傻姑娘你真的是实践了“他那么渣我还渴望在他身上吊死”这种让人心疼却好扭曲的精神价值~女生的聊天里写“我是一个毫无价值的女孩,我想让你远离我这种垃圾”傻姑娘啊,
  • 说了多少句都敌不过一个故事: 我有一个哥,我哥帮我改了一下,我哥给我发了两篇他指导的本科生实验论文(综述和实验应该是不一样的吧[费解]),我哥现在是博士[微笑]