AI大模型
是数据创造价值的最短路径
数据只有被计算才能产生价值。从数据流动的视角看,数字化解决了“有数据”的问题,网络化解决了“能流动”的问题,智能化解决了“自动流动”的问题。数据流动的自动化,本质是用数据驱动的决策替代经验决策。
基于数据+算力+算法可以对物理世界进行状态描述、原因洞察、结果预测和科学决策。“数据+算法”将正确的数据(所承载知识)、在正确的时间、传递给正确的人和机器,以信息流带动技术流、资金流、人才流、物资流,优化资源的配置效率。
当AI大模型到来的时候,这套逻辑体系发生了什么变化呢?
第一个变化是:AI大模型产生高质量、在线、精准的数据。例如在自动驾驶领域,Corner cases(长尾场景)是指自动驾驶场景中那些不常见或一些极端的场景数据,数据比例可能只有1%,难以获取,影响自动驾驶的有效检测能力,可能引发很多安全问题。而AI大模型可以生成数百万个 Corner Cases,助力完成算法训练、测试验证和迭代优化。
第二个变化是:AI大模型自动生成高效率、场景化、高质量算法。2023年11月,特斯拉宣布已开始向员工推出完全自动驾驶(FSD)V12版本,FSD V12的C++代码只有2000行,减少了车机系统对代码的依赖,相比之下,FSD V11有30多万行代码。背后是FSD V12完全采用神经网络进行车辆控制,从机器视觉到驱动决策都将由神经网络进行控制。FSD V12有望打造自动驾驶领域的基础底座,引领视觉算法的GPT时刻。
6
智能时代
数据+算法的“两个不等式”
自从2022年11月ChatGPT推出后,经常有人会问“为什么中国没有ChatGPT?” 如果你想真正找到答案,正确的提问姿势是“中国为什么没有OpenAI?中国为什么没有Snowflake?中国为什么没有Palantir?”今天,我们把所有的聚光灯都聚焦在ChatGPT上。
在我看来,ChatGPT只是美国数字技术创新森林里的一棵树上的两片叶子,今天我们把所有的聚光灯都聚焦在这片叶子上,把这片叶子都快烤黄了。我们需要思考的是:这棵树是什么样子?树根长成了什么样子?它有什么样的土壤?创新的森林生态是什么样子?只有我们把这片森林、这片土壤、这片树的规律都搞清楚了,我们才能找到这一轮数字技术创新的底层逻辑和规律。为什么美国会有这么多数字创新企业?原因有很多,但在我看来,最重要的原因是:“云计算+AI+数据”已成为数字时代创新的基础设施,是孕育孵化新企业、新产品的摇篮。
在这个新的创新基础设施之上,如果我们把时间尺度放到5年、10年或者15年,智能时代数据要素创造价值的方式,将与两个重要的“不等式”密切相关。
第一个是“数据不等式”:未来AI生成的数据量,将远远大于人类生产的数据量。AI过去一年生成的图像,超过过去150年人类拍摄的所有照片数量。欧盟执法机构“欧洲刑警组织(Europol)”的一份报告预测,到2026年互联网上多达90%的内容是由AI创建或编辑的。
第二是“算法不等式”:AI生成的代码量,将远远大于人类编写的代码量。ChatGPT已经通过了谷歌L3级代码工程师(入门级,18万美元年薪)测试。国内研究机构CSDN测试结果是,GPT-4的软件编程能力相当于中国月薪3万元人民币的程序员水平。GitHub的一项测试表明,完成同样的一个软件最小可行产品(MVP)开发任务,AI工具帮助一位只有4年编程经验的巴基斯坦程序员,只用两周就完成了开发任务。而另一位拥有19年编程经验的资深程序员,因为没有使用AI工具,完成同样任务花费了5倍的时间,20倍的成本。
数据要素的问题要看当前,更要看长远。未来,更多的数据叠加更多的算法,意味着AI将彻底改变数据要素创造价值的方式,并带来指数级的价值增量。
是数据创造价值的最短路径
数据只有被计算才能产生价值。从数据流动的视角看,数字化解决了“有数据”的问题,网络化解决了“能流动”的问题,智能化解决了“自动流动”的问题。数据流动的自动化,本质是用数据驱动的决策替代经验决策。
基于数据+算力+算法可以对物理世界进行状态描述、原因洞察、结果预测和科学决策。“数据+算法”将正确的数据(所承载知识)、在正确的时间、传递给正确的人和机器,以信息流带动技术流、资金流、人才流、物资流,优化资源的配置效率。
当AI大模型到来的时候,这套逻辑体系发生了什么变化呢?
第一个变化是:AI大模型产生高质量、在线、精准的数据。例如在自动驾驶领域,Corner cases(长尾场景)是指自动驾驶场景中那些不常见或一些极端的场景数据,数据比例可能只有1%,难以获取,影响自动驾驶的有效检测能力,可能引发很多安全问题。而AI大模型可以生成数百万个 Corner Cases,助力完成算法训练、测试验证和迭代优化。
第二个变化是:AI大模型自动生成高效率、场景化、高质量算法。2023年11月,特斯拉宣布已开始向员工推出完全自动驾驶(FSD)V12版本,FSD V12的C++代码只有2000行,减少了车机系统对代码的依赖,相比之下,FSD V11有30多万行代码。背后是FSD V12完全采用神经网络进行车辆控制,从机器视觉到驱动决策都将由神经网络进行控制。FSD V12有望打造自动驾驶领域的基础底座,引领视觉算法的GPT时刻。
6
智能时代
数据+算法的“两个不等式”
自从2022年11月ChatGPT推出后,经常有人会问“为什么中国没有ChatGPT?” 如果你想真正找到答案,正确的提问姿势是“中国为什么没有OpenAI?中国为什么没有Snowflake?中国为什么没有Palantir?”今天,我们把所有的聚光灯都聚焦在ChatGPT上。
在我看来,ChatGPT只是美国数字技术创新森林里的一棵树上的两片叶子,今天我们把所有的聚光灯都聚焦在这片叶子上,把这片叶子都快烤黄了。我们需要思考的是:这棵树是什么样子?树根长成了什么样子?它有什么样的土壤?创新的森林生态是什么样子?只有我们把这片森林、这片土壤、这片树的规律都搞清楚了,我们才能找到这一轮数字技术创新的底层逻辑和规律。为什么美国会有这么多数字创新企业?原因有很多,但在我看来,最重要的原因是:“云计算+AI+数据”已成为数字时代创新的基础设施,是孕育孵化新企业、新产品的摇篮。
在这个新的创新基础设施之上,如果我们把时间尺度放到5年、10年或者15年,智能时代数据要素创造价值的方式,将与两个重要的“不等式”密切相关。
第一个是“数据不等式”:未来AI生成的数据量,将远远大于人类生产的数据量。AI过去一年生成的图像,超过过去150年人类拍摄的所有照片数量。欧盟执法机构“欧洲刑警组织(Europol)”的一份报告预测,到2026年互联网上多达90%的内容是由AI创建或编辑的。
第二是“算法不等式”:AI生成的代码量,将远远大于人类编写的代码量。ChatGPT已经通过了谷歌L3级代码工程师(入门级,18万美元年薪)测试。国内研究机构CSDN测试结果是,GPT-4的软件编程能力相当于中国月薪3万元人民币的程序员水平。GitHub的一项测试表明,完成同样的一个软件最小可行产品(MVP)开发任务,AI工具帮助一位只有4年编程经验的巴基斯坦程序员,只用两周就完成了开发任务。而另一位拥有19年编程经验的资深程序员,因为没有使用AI工具,完成同样任务花费了5倍的时间,20倍的成本。
数据要素的问题要看当前,更要看长远。未来,更多的数据叠加更多的算法,意味着AI将彻底改变数据要素创造价值的方式,并带来指数级的价值增量。
实践中数据到底是如何创造价值的?
1、快递物流。10多年前,国内一家物流公司每天的快递订单量达到1500万单,之后尽管采取了各种方法,但订单量很难有大的突破。过了几年快递行业出现一项新技术——电子面单,快递公司在车辆、人员、仓库等实物资源没有大的变化背景下,每天订单量达到5000万单、提高了3.3倍。电子面单最大的价值是实现了快递订单端到端的数字化,以数据流优化了物流资源配置效率。
2、制造行业。10年前的时候,马斯克在他的网站上发表了一片文章,文章的标题是“why the US can beat China : the facts about SpaceX cost”,在所有人都认为中国是全球成本最低的国家时,马斯克说“我要把美国航空发射器的成本降到中国的1/7”。这个10年前的预言今天实现了。SpaceX每公斤发射成本从18500美元降到2720美元。这背后的一个重要因素在于:SpaceX在产品开发早期阶段,通过数据+算法的模拟择优,替代传统实物试验,大幅降低了研制成本、缩短周期,提高研发效率和产品质量。
3、宾馆服务。旅游宾馆行业是一个非常传统的行业,但国内有一家公司,它拥有的房间数量不是全国第一,但是市值最高的时候是这个行业第2到第9名市值之和。这背后是什么原因呢?背后是数据驱动的决策,重新构建了一套系统性运营体系。它针对客户提供差异化的极致服务,私域拥有会员就数达1.7亿,86%的订单来自于私域流量渠道。就像他们董事长所说的,以前这个宾馆连锁企业是最懂技术的酒店管理公司,未来是最懂酒店的技术服务公司。
4、国防军事。2020年10月,美国国防部发布了首份《数据战略》报告,最重要的一句话是:基于数据决策重新定义美国国防部。美国防部的愿景是“成为一个以数据为中心的机构,通过快速规模使用数据来获得作战优势和提高效率。”在美国国防部看来:数据日益成为国防部各个流程、算法和武器系统的“燃料”;数据的价值在于,在联合全域作战上,在战场上形成数据优势;在高级领导决策支持上,利用数据改进国防部管理工作;在具体业务分析,使用数据推动所有层级的明智决策。说来说去,核心就是用数据推动所有美国国防部各层级的科学决策。
概括起来,无论是制造行业、快递物流、宾馆服务,还是国防军事,数据作为一种要素的底层逻辑是一致的,就是基于数据+算法的科学决策,优化资源配置的效率,提升核心竞争力。
1、快递物流。10多年前,国内一家物流公司每天的快递订单量达到1500万单,之后尽管采取了各种方法,但订单量很难有大的突破。过了几年快递行业出现一项新技术——电子面单,快递公司在车辆、人员、仓库等实物资源没有大的变化背景下,每天订单量达到5000万单、提高了3.3倍。电子面单最大的价值是实现了快递订单端到端的数字化,以数据流优化了物流资源配置效率。
2、制造行业。10年前的时候,马斯克在他的网站上发表了一片文章,文章的标题是“why the US can beat China : the facts about SpaceX cost”,在所有人都认为中国是全球成本最低的国家时,马斯克说“我要把美国航空发射器的成本降到中国的1/7”。这个10年前的预言今天实现了。SpaceX每公斤发射成本从18500美元降到2720美元。这背后的一个重要因素在于:SpaceX在产品开发早期阶段,通过数据+算法的模拟择优,替代传统实物试验,大幅降低了研制成本、缩短周期,提高研发效率和产品质量。
3、宾馆服务。旅游宾馆行业是一个非常传统的行业,但国内有一家公司,它拥有的房间数量不是全国第一,但是市值最高的时候是这个行业第2到第9名市值之和。这背后是什么原因呢?背后是数据驱动的决策,重新构建了一套系统性运营体系。它针对客户提供差异化的极致服务,私域拥有会员就数达1.7亿,86%的订单来自于私域流量渠道。就像他们董事长所说的,以前这个宾馆连锁企业是最懂技术的酒店管理公司,未来是最懂酒店的技术服务公司。
4、国防军事。2020年10月,美国国防部发布了首份《数据战略》报告,最重要的一句话是:基于数据决策重新定义美国国防部。美国防部的愿景是“成为一个以数据为中心的机构,通过快速规模使用数据来获得作战优势和提高效率。”在美国国防部看来:数据日益成为国防部各个流程、算法和武器系统的“燃料”;数据的价值在于,在联合全域作战上,在战场上形成数据优势;在高级领导决策支持上,利用数据改进国防部管理工作;在具体业务分析,使用数据推动所有层级的明智决策。说来说去,核心就是用数据推动所有美国国防部各层级的科学决策。
概括起来,无论是制造行业、快递物流、宾馆服务,还是国防军事,数据作为一种要素的底层逻辑是一致的,就是基于数据+算法的科学决策,优化资源配置的效率,提升核心竞争力。
2月22日微语报,星期四,农历正月十三,工作愉快,生活喜乐!
一份微语报,众览天下事!#公众号:inews7
1、个税年度汇算即将开始!昨日起可预约办理。
2、獐子岛违规披露案被最高检列入典型案例:全面惩处涉上市公司违法犯罪。
3、贵州普安山火已得到控制,两名救火人员不幸牺牲。
4、红海危机冲击国际海运,韩国至欧洲海运费暴涨72%。
5、齐齐哈尔体育馆坍塌致11死7伤事故调查报告公布,51人被追责。
6、上海飞青岛票价只要14元!机票价格大跳水,2月下旬部分机票低至0.3折。
7、14年来首次!华为超过苹果拿下国内平板电脑单季出货量第一。
8、美国有线电视新闻网(CNN)评出全球50种最好吃面包,中国烧饼入选。
9、郑州:高层次人才在郑首次购买新房,按房价50%给予最高300万元补贴。
10、中国驻中非共和国使馆再次提醒中国公民:切勿前往首都班吉以外地区。
11、30年来首次,俄罗斯计划在2024年发射40多枚太空火箭。
12、第4次!美国否决联合国安理会停火草案。
一份微语报,众览天下事!#公众号:inews7
1、个税年度汇算即将开始!昨日起可预约办理。
2、獐子岛违规披露案被最高检列入典型案例:全面惩处涉上市公司违法犯罪。
3、贵州普安山火已得到控制,两名救火人员不幸牺牲。
4、红海危机冲击国际海运,韩国至欧洲海运费暴涨72%。
5、齐齐哈尔体育馆坍塌致11死7伤事故调查报告公布,51人被追责。
6、上海飞青岛票价只要14元!机票价格大跳水,2月下旬部分机票低至0.3折。
7、14年来首次!华为超过苹果拿下国内平板电脑单季出货量第一。
8、美国有线电视新闻网(CNN)评出全球50种最好吃面包,中国烧饼入选。
9、郑州:高层次人才在郑首次购买新房,按房价50%给予最高300万元补贴。
10、中国驻中非共和国使馆再次提醒中国公民:切勿前往首都班吉以外地区。
11、30年来首次,俄罗斯计划在2024年发射40多枚太空火箭。
12、第4次!美国否决联合国安理会停火草案。
✋热门推荐