重磅!OpenAI推出新旗舰模型GPT-4o
重磅!当地时间5月13日,虽然没有带来备受期待的人工智能(AI)搜索引擎,但是OpenAI通过直播展示了产品更新,公司首席技术官Mira Murati向外界展现了多项与ChatGPT有关的更新。
综合媒体报道,整体来看,活动主要分为两大部分:推出新旗舰模型“GPT-4o”,以及在ChatGPT中免费提供更多功能。其中最重磅的是新的模型GPT-4o。根据OpenAI的官网解释,"o"代表“omni”。
该词意为“全能”,源自拉丁语“omnis”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。分析指出,这也是朝着更自然的人类与计算机交互迈出的一步。
根据OpenAI的官方新闻稿,GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”
在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒,GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,让GPT-4无法直接观察音调、说话的人和背景噪音,也无法输出笑声、歌唱声和表达情感。
与之相比,GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。在录播视频中,两位高管做出了演示:机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸,还可以根据用户要求变换语调。
OpenAI称,“我们跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。由于GPT-4o是我们第一个结合所有这些模式的模型,因此我们仍然只是浅尝辄止地探索该模型的功能及其局限性。”
OpenAI研究员Mark Chen表示,新模型具有“感知情绪”的能力,能输出笑声、歌唱或表达情感,还可以处理用户打断它的情况。在直播中,OpenAI演示了一段OpenAI员工与GPT-4o对话的视频,模型反应速度与人类相近,GPT-4o可利用手机摄像头描述其“看到”的东西。
除了在直播中重点强调的功能,在OpenAI的技术文档中,我们看到在GPT4-o的能力列表中,还包含3D能力、图像诗能力、转换卡通照片等能力。
更多工具免费解锁
ChatGPT的免费用户也能用上最新发布的GPT-4o模型(更新前只能使用GPT-3.5),来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,将面对海量的新增用户。
当然,付费用户将会获得更高的消息限额(OpenAI说至少是5倍)。当免费用户用完消息数量后,ChatGPT将自动切换到 GPT-3.5。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。
另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。
OpenAI推出适用于macOS的ChatGPT桌面应用程序,通过简单的键盘快捷键(Option + Space)可以立即向ChatGPT提问,还可以直接在应用程序中截取屏幕截图与机器人进行讨论。
未能参加直播活动的OpenAI首席执行官山姆·奥特曼(Sam Altman)在社交平台X上发帖表示:“我们的新模型:GPT-4o是我们迄今为止最优秀的模型。它既智能又快速,并且是原生多模态模型。”
不少科技界人士发表了对OpenAI此次产品更新的看法。“我没想到GPT-4o会接近GPT-5。传闻中OpenAI的‘Arrakis’模型就采用多模态输入和输入。事实上,它可能是GPT-5的一个早期检查点(checkpoint),尚未完成训练。”英伟达高级科学家Jim Fan在社交媒体上评论称。
Jim Fan认为,在谷歌召开I/O大会前,OpenAI宁愿发布超过人们对GPT-4.5心理预期的产品,也不愿因为推出达不到人们期望的GPT-5,而让人感到失望。此外,谁先赢得苹果,谁就将大获全胜,与iOS整合有几个层次,例如抛弃Siri,OpenAI为iOS提炼出一个更小层级、设备上运行的GPT-4o。虽然此次未公开相关论文,加利福尼亚大学圣克鲁兹分校教授Xin Eric Wang还是评论认为,一个演示胜过千篇论文。
重磅!当地时间5月13日,虽然没有带来备受期待的人工智能(AI)搜索引擎,但是OpenAI通过直播展示了产品更新,公司首席技术官Mira Murati向外界展现了多项与ChatGPT有关的更新。
综合媒体报道,整体来看,活动主要分为两大部分:推出新旗舰模型“GPT-4o”,以及在ChatGPT中免费提供更多功能。其中最重磅的是新的模型GPT-4o。根据OpenAI的官网解释,"o"代表“omni”。
该词意为“全能”,源自拉丁语“omnis”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。分析指出,这也是朝着更自然的人类与计算机交互迈出的一步。
根据OpenAI的官方新闻稿,GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”
在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒,GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,让GPT-4无法直接观察音调、说话的人和背景噪音,也无法输出笑声、歌唱声和表达情感。
与之相比,GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。在录播视频中,两位高管做出了演示:机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸,还可以根据用户要求变换语调。
OpenAI称,“我们跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。由于GPT-4o是我们第一个结合所有这些模式的模型,因此我们仍然只是浅尝辄止地探索该模型的功能及其局限性。”
OpenAI研究员Mark Chen表示,新模型具有“感知情绪”的能力,能输出笑声、歌唱或表达情感,还可以处理用户打断它的情况。在直播中,OpenAI演示了一段OpenAI员工与GPT-4o对话的视频,模型反应速度与人类相近,GPT-4o可利用手机摄像头描述其“看到”的东西。
除了在直播中重点强调的功能,在OpenAI的技术文档中,我们看到在GPT4-o的能力列表中,还包含3D能力、图像诗能力、转换卡通照片等能力。
更多工具免费解锁
ChatGPT的免费用户也能用上最新发布的GPT-4o模型(更新前只能使用GPT-3.5),来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,将面对海量的新增用户。
当然,付费用户将会获得更高的消息限额(OpenAI说至少是5倍)。当免费用户用完消息数量后,ChatGPT将自动切换到 GPT-3.5。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。
另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。
OpenAI推出适用于macOS的ChatGPT桌面应用程序,通过简单的键盘快捷键(Option + Space)可以立即向ChatGPT提问,还可以直接在应用程序中截取屏幕截图与机器人进行讨论。
未能参加直播活动的OpenAI首席执行官山姆·奥特曼(Sam Altman)在社交平台X上发帖表示:“我们的新模型:GPT-4o是我们迄今为止最优秀的模型。它既智能又快速,并且是原生多模态模型。”
不少科技界人士发表了对OpenAI此次产品更新的看法。“我没想到GPT-4o会接近GPT-5。传闻中OpenAI的‘Arrakis’模型就采用多模态输入和输入。事实上,它可能是GPT-5的一个早期检查点(checkpoint),尚未完成训练。”英伟达高级科学家Jim Fan在社交媒体上评论称。
Jim Fan认为,在谷歌召开I/O大会前,OpenAI宁愿发布超过人们对GPT-4.5心理预期的产品,也不愿因为推出达不到人们期望的GPT-5,而让人感到失望。此外,谁先赢得苹果,谁就将大获全胜,与iOS整合有几个层次,例如抛弃Siri,OpenAI为iOS提炼出一个更小层级、设备上运行的GPT-4o。虽然此次未公开相关论文,加利福尼亚大学圣克鲁兹分校教授Xin Eric Wang还是评论认为,一个演示胜过千篇论文。
【我国科学家发现银河系晕里的巨大磁环】近日,中国科学院国家天文台(以下简称国家天文台)徐钧博士和研究员韩金林通过分析银河系内的脉冲星和银河系外的射电源法拉第旋转效应分布数据,揭示了银河系的晕中有一个巨大的磁环结构。这对宇宙线粒子的传播、星系气体的动力学和宇宙磁场演化等研究领域提供了至关重要的观测结果。该成果发表在《天体物理学报》上。论文传送门☞https://t.cn/A6HtPaXW
宇宙磁场的起源和演化是天体物理学中一个长期悬而未决的重大难题,是很多大射电望远镜项目包括未来平方公里阵列射电望远镜(SKA)在内的立项优先课题。世界各大射电望远镜都在发展和提升偏振测量能力,致力于在这一方向上发力。其中,测量银河系的大尺度磁场结构是一项相当具有挑战性的工作。
近30年来,韩金林深耕银河系磁场研究,取得了一系列重要成果。早在1997年,在银晕区域,韩金林等学者就率先认证出法拉第旋转效应在内银河天空具有反对称的符号分布,说明了银盘上下的银晕里具有方向相反的环向磁场结构。这一研究成果被国际天文界广泛采纳,成为银河系磁场结构模型的基本内容,也被写入多本国际经典教科书。
不过,关于银晕磁环结构的大小和强度20多年来一直难以测量。这个磁环究竟是在整个银晕中存在还是仅仅在局部区域产生,银晕磁环的强度和大小究竟如何等,至今仍是科学家难以解答的问题。
在最新发表的研究中,韩金林创新性提出将太阳附近的脉冲星法拉第旋率测量值作为本地星际介质的贡献从河外射电源法拉第效应天空分布的数值中扣除,以得到巨大银晕的法拉第旋转效应分布。
徐钧收集了所有相关的数据,同时凭借中国天眼FAST测量了众多暗弱脉冲星。
科研人员介绍,按这一想法处理完数据后发现,全部天空的平均法拉第效应呈现出对银道坐标的反对称分布,并且反对称分布不再局限于内银河区域,而是充满全部天空,从银河系中心区域一直延伸到其相反的方向。
这说明,银晕中的磁环从离银河系中心6千光年一直延伸到5万光年(太阳大约在3万光年)。太阳附近的局部区域的星际介质显然是巨大的磁环的一部分,其基本性质和表征与大磁环基本一致,但因为深入银盘而使其效应表现得更强。
业内专家认为,该研究结果是银河系整体磁场研究的新里程碑。(来源:中国科学报 甘晓)
宇宙磁场的起源和演化是天体物理学中一个长期悬而未决的重大难题,是很多大射电望远镜项目包括未来平方公里阵列射电望远镜(SKA)在内的立项优先课题。世界各大射电望远镜都在发展和提升偏振测量能力,致力于在这一方向上发力。其中,测量银河系的大尺度磁场结构是一项相当具有挑战性的工作。
近30年来,韩金林深耕银河系磁场研究,取得了一系列重要成果。早在1997年,在银晕区域,韩金林等学者就率先认证出法拉第旋转效应在内银河天空具有反对称的符号分布,说明了银盘上下的银晕里具有方向相反的环向磁场结构。这一研究成果被国际天文界广泛采纳,成为银河系磁场结构模型的基本内容,也被写入多本国际经典教科书。
不过,关于银晕磁环结构的大小和强度20多年来一直难以测量。这个磁环究竟是在整个银晕中存在还是仅仅在局部区域产生,银晕磁环的强度和大小究竟如何等,至今仍是科学家难以解答的问题。
在最新发表的研究中,韩金林创新性提出将太阳附近的脉冲星法拉第旋率测量值作为本地星际介质的贡献从河外射电源法拉第效应天空分布的数值中扣除,以得到巨大银晕的法拉第旋转效应分布。
徐钧收集了所有相关的数据,同时凭借中国天眼FAST测量了众多暗弱脉冲星。
科研人员介绍,按这一想法处理完数据后发现,全部天空的平均法拉第效应呈现出对银道坐标的反对称分布,并且反对称分布不再局限于内银河区域,而是充满全部天空,从银河系中心区域一直延伸到其相反的方向。
这说明,银晕中的磁环从离银河系中心6千光年一直延伸到5万光年(太阳大约在3万光年)。太阳附近的局部区域的星际介质显然是巨大的磁环的一部分,其基本性质和表征与大磁环基本一致,但因为深入银盘而使其效应表现得更强。
业内专家认为,该研究结果是银河系整体磁场研究的新里程碑。(来源:中国科学报 甘晓)
【#尚无研究表明太阳耀斑地磁暴影响人体#】统计数据显示,5月以来,太阳活动持续活跃,短短一周,爆发了10个X级耀斑和60余个M级耀斑。此外,中国气象局国家空间天气监测预警中心及美国国家海洋和大气管理局等机构近日相继发布强地磁暴预警。有不少网友在社交平台上表示,最近深夜失眠、上班犯困,认为这是太阳耀斑和地磁暴的“锅”。也有网友担心,太阳耀斑和地磁暴会影响乘坐飞机出行。对此,美国国家太阳天文台科学家、科罗拉多大学博尔德分校助理教授玛丽亚·卡扎琴科近日在接受记者采访时表示,尚无科学研究表明太阳耀斑和地磁暴会对人体产生影响,人们可以正常生活,包括乘坐飞机出行。(新京报,泽塔)#地磁暴的这几天你睡眠如何#
✋热门推荐