数据是AIGC时代的“命门” 亚马逊云科技全面布局企业数据服务

基础模型搭建了之后,企业对生成式AI的建设关键来到数据层面。

近日,在亚马逊云科技“无数据不模型——生成式AI时代的数据基座”媒体沟通会上,亚马逊云科技大中华区产品部总经理陈晓建强调了数据在生成式AI时代的关键作用。他表示,数据在生成式AI时代处于核心地位,企业要想在生成式AI时代取得成功,必须从数据做起,利用自身的数据构建具有商业价值的AI应用。

陈晓建认为,企业需要构建以下3个方面的数据能力:模型微调和预训练所需的数据处理能力、利用专有数据与模型快速结合以产生独特价值的能力、有效处理新数据以助推生成式AI应用持续快速发展的能力,在被问及AIGC时代,亚马逊云科技在人工智能推理成本和训练成本上是否不像在原本的商业模式上有优势时,亚马逊云科技方面表示,还是看重客户最终要的是什么。言下之意,亚马逊云科技希望无论AIGC时代的服务成本怎么变动,自身的商业模式仍是以提供云基础设施、模型层、应用层的工具与服务为主。

数据处理为何重要

大量的、高质量的数据对生成式AI的重要性已经不言而喻。

亚马逊云科技方面此次表示,如果每个公司都能访问相同的基础模型,那么各个公司处于同一起跑线;而能够利用自身的数据构建具有真正商业价值的生成式AI应用的公司,就赢在了起跑线上。

可以说,生成式AI基础模型的局限性之一,在于无法及时拥有企业的专有数据。如果想让模型服务于企业发展,那么通过技术手段加速数据与模型的结合,就成了企业数据基座的关键之一。

陈晓建进一步表示,成功的企业需要懂业务、懂用户的生成式AI应用,而这些应用的构建需要从数据做起。他举了位于美国的人工智能初创公司Perplexity的例子,其通过将传统搜索、客户数据与大型语言模型相结合,实现了快速增长。

也是因此,这家公司是人工智能领域的“红人”。据悉,Perplexity正进行至少2.5亿美元的新一轮融资,估值可能达到25亿至30亿美元。而这家公司在过去四个月中刚刚进行了两笔大额融资,并且估值实现了飞跃:今年1月,Perplexity以5.4亿美元的估值筹集了近7400万美元;3月初,Perplexity以10亿美元的估值融资约6300万美元。

目前来说,用企业自身的数据去差异化生成式AI应用、通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调、持续预训练。这三种方式在不同应用场景中的适用性和对数据的要求不同。

亚马逊云科技的对策

亚马逊云科技强调了自身在数据基座构建方面的三大核心能力:模型微调和预训练所需的数据处理能力、利用专有数据与模型快速结合以产生独特价值的能力,以及有效处理新数据以助推生成式AI应用持续快速发展的能力。

在数据存储方面,亚马逊云科技提供的Amazon S3服务可以满足用户在微调和预训练基础模型时对数据存储的严格要求。同时,文件存储服务的亚毫秒级延迟和高吞吐性能,将进一步加快模型优化速度。

数据清洗和治理方面,亚马逊云科技通过 Amazon EMR Serverless和Amazon Glue等服务,帮助企业高效完成数据清理、去重和分词等操作,使企业能够专注于AI业务创新。

此外,亚马逊云科技还着重强调了其在向量搜索和无服务器架构方面的创新。其中,检索增强生成(RAG)技术被普遍认为是实现数据与模型结合的主要途径之一。RAG通过将数据转换为向量并存储到向量数据库中,从而将语义的关联性转化为向量间的数学距离问题,以实现内容的关联性计算。

向量搜索与数据存储的结合可以带来多方面的好处,包括更高效和更精确的检索能力、处理和索引大规模的数据等。目前来说,结合向量搜索和数据存储的优势,可以构建出强大的信息检索系统,满足现代应用对于速度、准确性、可靠性和智能化的需求。

但这同时也带来一部分成本问题,比如需要更多的存储空间。对此,陈晓建告诉《每日经济新闻》记者,存储上确实会让成本有所增加,但能够在整个数据内容检索时取得更好的效果。

亚马逊云科技同时表示,自身已在8种数据存储中添加了向量搜索功能。客户还可以通过Amazon Memory DB内存数据库,降低生成式AI应用的模型调用成本和响应延迟。从亚马逊云科技对生成式AI时代数据基座的看重,可以看到数据处理的重要性以及企业在这一领域面临的挑战与机遇。对于亚马逊云科技来说,为AIGC时代的企业提供更全面的服务也是机遇与挑战并存。

#A股#

在端侧大模型赛道,Google、微软、三星等都在着力在手机、PC和各种高新能智能终端上推动生成式AI模型的开发。这次苹果发布OpenELM,意味着它正式加入开源大模型阵营,这次苹果开源的是一个在设备端运行的AI模型OpenELM并已经在AI代码社区Huggang Face上发布,由多个旨在高效执行文本生成任务的小模型组成。苹果同时还公开了代码、权重、数据集、训练全过程。
OpenELM作为一个新的开源大语言模型(LLM)家族,能够依托单一设备平台运行,完全无需借助云服务器。OpenELM模型包含八个主要模型,四个为预训练模型,另四个为指令微调模型,参数规模在2.7亿-30亿间(大模型中人工神经元间的连接数量,参数越多通常意味着性能更好、功能更强但并不绝对),而微软的Phi-3 Mini模型的参数规模为38亿。
这次苹果发布的OpenELM模型,适合在商用笔记本电脑以及部分智能手机上运行,意味着AI终端真的不远了。

话说,用企业自身的数据去差异化生成式AI应用、通过数据定制基础模型的方式主要分为三大类:检索增强生成(RAG)、微调和持续预训练。#休鲜茶话# 对此,亚马逊云科技强调了自身在数据基座构建的三大核心能力:模型微调和预训练所需的数据处理能力、利用专有数据与模型快速结合以产生独特价值的能力,以及有效处理新数据以助推生成式AI应用持续快速发展的能力。#武汉·武汉大学先进制造与人工智能实验室[地点]#


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • #豫见新一代[超话]# #劳劳的网球场[超话]#[微风]#每日一善#[微风] #阳光信用# ☀早安[太阳]我每看运动会时,常常这样想:优胜者固然可敬,但那虽然落
  • 钟​亚​彬——医学‎硕​士‎学​位,家中​七​代‎祖​传‎中医,原​通州​骨伤医院​针​刀科医‎师​,因工​作压‎力大加‎上‎产后​肥‎胖,喝‎奶​昔减肥​40
  • 2、八字中喜用神可以或许互补,这个首要是从各自八字中的旺神,整体倾素来讲的,不要一看到对方的八字中有自己的忌神,就惊慌失措;不然能够错过好的姻缘;对方的八字中国
  • #推文[超话]#推个好文[羞嗒嗒]泪点低的宝子可以自备纸巾[doge]结局HE 《晏晏少年时》作者:蒋淮琅简介:钟莹倒霉,没能熬死老男人继承巨额财产,先把自己作
  • 我真正的心声,我希望世界上的人都痛苦,我真心实意地希望所有人都痛苦,世界就是对我不公平,作为报复,我就是希望所有人过得都不好。我虔诚地希望世界上的所有人都要在痛
  • —— ENKEI Racing Revolution这是ENKEI对于本家的Racing Revolution系列轮圈的注解,可见ENKEI对这个系列的轮圈充满
  • 具俊晔也通过媒体回应,说当年不允许偶像谈恋爱,所以想了很久,最后还是和大s分手了,但他也说分手后再也没遇到比大s更好的女人了“在我心里,她一直是一个温暖美好的人
  • 这个世界从未缺过爱,只是忙碌的生活让我们忽视,其实爱不在远方,就在近前,善待身边的每个人,尊重身边的每个人,赏识身边的每个人。这个世界从未缺过爱,只是忙碌的生活
  • 秦始皇称帝后,完全放弃分封制,其实寒了绝大多数功勋武将的心,这也是秦朝迅速灭亡的重要原因。秦朝快速灭亡,有一个很重要的因素,就是秦国本身也是一个存在几百年的古老
  • 公司励志为中国乃至世界的人调理亚健康,公司从研发试验到市场推广,经过专业的层层把关,保证产品货真价实,走健康之路。公司励志为‮国中‬乃至世界‮人的‬调理​亚健康
  • 而且蔡卓宜的发际线比鞠婧祎自然,也没有刻意营造自己的发量多是纯天然的,就是大大方方展现,发量少想要通过植发更好看有什么丢人的,鞠婧祎不被接受的原因就是明明是后期
  • 3.适度点餐不浪费点餐时,优先选择无接触电子菜单和扫码点菜。做好手卫生,在就餐前、入厕后洗手。
  • #EXO[超话]#[心]#吴世勋[超话]# 【那年今日】 210405 somebymi ins story更新 世勋 相关一则 【资源:萌琪】【禁二改商用
  •   据悉,“春晖美厨”计划旨在改善农村学校厨房条件,让在校学生都能吃得上干净、卫生的“营养餐”。[赞][赞]#青岛教育#【[给力]人民网等媒体报道青岛黄岛区学生
  • 当然,平时佩戴的耳环、戒指可以不算,但当天为了闻法特意打扮却不合理,因为到这里并非其他目的,而是为了听闻佛法,所以有些居士应该注意。 #极乐愿文大疏# 洒扫完讲
  • 어려움, 좌절, 도전에 직면하여 당신이 기꺼이 자신을 믿고 끊임없이 노력한다면, 현재의 삶이 0 부터 시작한다고 해도 당신은 할 수 있습니다.
  • 开展应急拉动演练为全力确保清明节期间哈市道路交通秩序安全稳定,4 月 4...【Martha Stewart Wine】葡萄酒全场65折!#哈尔滨买房#【清明节
  • 我端起酒盅,跟风致词,张同学来我家,盟兄弟都升值,咱喝个狗臭屁酒。看我想劝他的表情,大张马上止住话题,说他追加两句,摇头晃脑地吟道:有约小白酒,趁兴喝一口。
  • ☁️想念春英女士的第28天☁️嗨 奶奶 我又来啦[允悲]前天的梦里又有你了哈哈哈果不其然又见面咯~我记得你说过你走后会变成天上的云朵保护我的飞机✈️没有危险昨天
  • 真正决定人与人差距的,不是天赋与努力,而是“习惯霸权”