#香山调试直播# 香山芯片调试目标完成!

记录一些流水账:

2021年6月22日,香山在RISC-V中国峰会上第一次亮相,这是当时公开的国际上性能最高的开源RISC-V处理器核设计,受到国内外的很多关注,如今在GitHub上已有近2500个Star,250多个Fork。虽然我们的报告是中文的,但却有不少英文报道,甚至还有来自俄罗斯的关注。可以说,香山成为国际上最受关注的开源芯片项目之一。

2021年7月15日,第一代香山“雁栖湖”流片。但接下来由于受到全球芯片产能影响,我们不得不经历漫长的等待期。因为许久没有回片后的消息,有一些关注香山的朋友发来小心翼翼的询问:“香山是不是流片失败了?”流片失败,就是指香山无法点亮,也就意味着它就是一块石头。

2022年1月20日,等待了整整半年,香山终于回片了。硬件调试存在很大不确定性,很可能1个bug就会需要耗上1-2个月才能解决。而硬件问题解决不了,软件调试就会受到影响。尽早发现硬件问题,此时的香山就如同刚从医院拿回来的一份尚未打开的检查报告——面对它心中充满忐忑,不知道结果是好是坏。如果要等春节假期结束后才能看报告,这个年我们会过得心里很不踏实。另外,还存在一个不确定性,就是疫情防控。前段时间北京出现疫情,导致不少同学无法回家。但另一方面,由于冬奥会、两会等一系列活动,如果其他地方出现疫情,也可能导致离京后一段时间内甚至整个2月不能返京,那就会再空耗一个月。

我们希望能尽早消除一些不确定性,否则过年心里也不踏实。时间,对于香山调试非常宝贵。于是,香山团队的多位小伙伴(徐易难、李作骏、王诲喆、勾凌睿、张紫飞、蔺嘉炜、李乾若、甄好)决定留在北京攻关调试,加上唐丹和我,组成了一支攻关调试小分队。其中有几位是因为老家疫情而留在了北京,也有本来就是北京人,除了这些这些线下的小伙伴,还有全国各地的老师和同学一起在线参与。

1月26日开始,采用香山枫叶红底色的主板陆续从深圳寄到北京。此前,1月22-24日,深圳团队的蔡晔老师、刘彤、何伟等已经在深圳焊好主板,完成了初步的调试,包括系统时钟、串口、Flash等,验证IO通路正确。

1月29日,调试攻坚战正式打响了。调试过程一开始出乎意料地顺利,虽然有些小曲折,但都很快解决。到1月30日,我们取得了不错的战果:
•CPU频率从24MHz切到1GHz;
•DDR4-2400初始化成功,并稳定运行;
•Linux正常启动进入Shell;
•CoreMark成功运行,5.3分,与仿真完全一致。

1月30日晚上,收到了中国科学院大学公共管理学院刘继安老师的消息,是她和博士后徐艳茹希望观摩香山调试。晚上9点,徐博士先来到了调试现场,拍了几张照片,然后便跟我们说,她春节也不能回去过年,希望能全程观摩香山的调试过程。我们觉得应该很快就可以结束调试了,便欣然答应。但任何事情都不要高兴太早!

1月31日,大年夜。就在我们认为可以“牛年事、牛年毕”,可以在牛年就能跑出SPEC CPU2006分值、初步完成调目标时,现实狠狠地打了我们的脸——在运行SPEC CPU2006时,DDR4-2400稳定性存在问题,会导致返回数据出现随机错误。DDR是芯片调试过程最麻烦的问题,看来我们终究还是要面对。

我们分头吃年夜饭。下午2点,唐丹老师回家和家人一起吃了顿年夜饭;下午4:30,唐老师又过来和我们一起吃了一顿年夜饭,然后回到调试作战室放松:春晚,PS5,瓜子……晚上7点,我再回家和家人又吃了一顿年夜饭。一个难忘的大年夜!

大年初一到初三,大家休息了三天。

初四,重新整装上阵。内存专家李作骏全力攻占DDR稳定性问题,其他人全力配合。全志D1-H项目负责人孙彦邦提到当时在全志时DDR调试也是难点,他推荐了在Linux下的memtester来测试内存。

初五,徐易难很快便在Linux下编译好memtester,并开始测试。初步测试访存确实不稳定,内存在作Bit Flipping时会出现8KB数据不正确。于是开始尝试修改CPU频率,1GHz提高到1.1GHz,1.26GHz,但都不稳定;那就给CPU降频,降到800MHz、600MHz,似乎访存稳定性好一些,但还是会随机出错。

唐丹老师查看DDR PHY手册,发现PHY和DIMM的VRef配置不同步,修改后稳定性得到改善,但memtester还是会出现随机访存出错,只是出现概率降低了。但是,哪怕概率再低,也不可接受——对于理论上1GHz频率下每秒可运行60亿条指令的香山来说,哪怕是亿分之一的随机出错概率,也意味着每秒会出现几十次访存数据错误,这是不可接受的。我们必须要把访存调稳定。

初六,大家继续尝试——修改DDR Trainimg参数,修改Linux启动时内存容量,改变DDR供电电压……始终无法消除DDR访存的随机出错问题。我们怀疑DDR信号完整性问题,希望看一下DDR信号的眼图。开始一通打电话借设备,我们借到了一台DDR逻辑分析仪。这这台设备和HMTT很像,也是插在DIMM槽,但它内部提供高频采样时钟,可以直接抓DDR访存数据信号。我们花了半天的时间研究如何使用,当搞清楚后,发现在DDR-2400配置下采不到预想的信号。晚上9点多,打电话给设备代理商,被告知这台设备采购时没有选支持2400的模块,现在还支持DDR-1600。燃起的希望又熄灭了。

初七,唐丹老师又开始打一轮电话,又向郝沁汾老师借来一台示波器。有人建议看一下电源是否稳定,波动幅度是否太大,可以换一下精密电源。唐老师、徐易难立刻开始测试电源稳定性,发现真的会出现上下60-80mV的波动。那时,看到这个几十毫伏的波动,似乎大家心里涌出一丝欣喜,希望这就是DDR访存不稳定的问题所在。唐丹马不停蹄地区采购精密电源,不幸的是在换电源后,我们使用最多、相对最稳定的一块板卡“牺牲”了——烧了!来不及难过,立刻又切换到另一块板卡开始测试起来。结果有点沮丧,换了精密电源后依然无法消除访存随机性问题。

李作骏通过对DDR信号进行仿真,发现DDR DQS信号的ODT参数设置存在问题,同时把所有的访存性能相关的参数调到最保守设置。大家又寄希望于这次DDR参数修改。

此时,于是另一条调试网卡的战线开始启动,由王诲喆担任主攻手:测试网卡时钟信号、调整GMAC频率,设置设备树,修改驱动——网卡很快就被识别出来了,能看到网卡能收包了,但是问题是不能发包。

初八,跑了一个晚上的memtester,连续运行了12个小时,只有一个访存出错。这次稳定性得到了极大的提高,但还没有彻底解决,运行SPEC CPU依然出错。这时,大家决定尝试一下将DDR降频到1600。DDR-1600配置下,李作骏又对DDR Training做了优化,调高了Refresh Burst数量,激动人心的时刻发生了——之前跑不过的SPEC CPU应用都能跑完了!DDR访存稳定性问题终于解决了!

从初八开始,勾凌睿便开始用SPEC CPU2006程序烤机,香山频率设置为1GHz,DDR设置为1600,连续几十个小时的运行,再也没有出现过错误了。当然,这并不是最终目标,我们知道DDR访存性能对整个香山芯片的性能至关重要,接下来我们还继续优化DDR性能。

另一条战线,王诲喆仍然在调试网卡。在香山上用tcpdump能看到从另一台机器发过来的网络包,对比发送端的wireshark,内容正确。但是发送始终存在问题,ping依然不通。

初九,跑了一天的SPEC CPU,再也没有出错了,大家开始期待香山的SPEC CPU 2006分值了。网卡调试那边,手动修改了mac地址后,香山能收到ping,但是发送依然有问题。

初十,在修复了一个串口驱动小问题后,终于得到SPEC CPU 2006分值了,香山在1GHz频率、DDR-1600配置下,分值为5.97。这个数字对于香山来说,是一个里程碑。但我们知道,这并不是香山的真实性能,因为这是把DDR-2400降频为DDR-1600后得到的结果,从数据来看,很多访存密集型应用性能受到了很大的影响。如果把DDR进一步优化,香山性能还将进一步提升。我们根据Roofline模型推演访存性能优化目标。

正月十二,王诲喆也终于将网卡调通,香山功能基本完备。有了网络,大家就可以远程访问香山了。

正月十五,李作骏对DDR-1600时序进行了初步优化,之前受DDR访存的应用性能得到了大幅提升,比如bzip2-liberty的运行时间从483s降到了265s。这也意味着SPEC CPU2006分值即使在DDR降频的情况下还可以有很大的提升。

至此,历时近3个星期的香山攻关调试取得了圆满成功。香山调试直播完毕。

衷心感谢所有关注和支持香山的朋友!后续我们仍然会向大家介绍香山后续的性能优化进展。

—————

图1:调试攻关任务清单完成!
图2:与DDR访存稳定性战斗
图3:稳定运行SPEC CPU2006程序
图4:网卡正常工作
图5:SPECCPU 2006分值与对应配置
图6:Roofline模型推演访存性能优化目标
图7-9:香山调试现场

奥特维三季度业绩交流会20211102
1、单晶炉目标
答:今年12月份单月产出60台,明年2-3月份单月100-120台的目标。目前主要受制一些国外标准件的进口疫情问题。市占率目标是N型市场占比20%。
2、键合机之前说是某家头部企业在验证,现在有多家是否有扩大?
答:之前是在功率器件厂家在验证,现在在华南、华东、西南和西北都找了当地的头部企业来进行客户验证。铝线键合机的问题主要是没有进口产品配件在其中,所以没有相关经验可以参考,需要慢慢来验证,验证范围也会扩大来让客户放心满意。目前试用客户在8家。
3、公司布局方向很多,那未来发展规划主要是哪个方向,有么有先后顺序?
答:研发费用今年投入很多,员工也一直在增长,光伏半导体和锂电都是现在发展很快的几个方向。现在公司发展很好,所以三个大方向目前没有优先等级,会全面发展。4季度会做一个组件封装的市场推广。半导体会开发一个核心设备,叠片的应用已经进行项目立项,还有封装中的超声波焊接等。
4、组件端设备中有没有新的产品介绍?
答:划片到串焊到叠片的一个整体系列规划。未来希望客户是在整个系列产品有个整体认可,来整体销售。这个是基于多主栅的小型生产线。
5、topcorn和HJT等方面客户需求?
答:客户需求肯定有的,目前产品研发进度和客户需求还是步调一致的。晶科发布新产品时我们也在和客户一直进行设备改进。目前客户银耗量比较大,所以降低这个是客户需求。
6、半导体键合机导入客户是需要有软件的导入,后期是否要去配合调整?
答:客户拿到键合机后我们后期不需要进行调整,客户会自己导入参数来生产不同的产品。
7、应收账款和现金流情况对收入和利润进行说明?
答:目前应收账款比较健康。
8、利润率同比增长怎么实现的?
答:目前销售的都是最新型号,所以毛利率比较高,供应的成本压力在上半年还没有完全体现,未来会有一定压力,不过会尽量维持。
9、产品周期是多久?
答:9年7代产品。未来正常情况1.5-2年会更新一代产品,但是客户端不一样会立刻更换,毕竟成本压力比较大。一般情况2-3代设备会共存。
10、光伏上下游博弈比较激烈,为啥公司会一直保持业绩高增长?
答:我们对于客户需求选择了更加贴近客户的设备方向,相比于同行来说更加适合客户发展需求。串焊机营收占比已经下降到70%多,所以未来其余的设备也会有更好的发展。
11、未来是否可以保持高增长及依据?
答:设备竞争优势在新产品上会逐步体现,串焊机的市占率还是会保持在60%-70%,但是行业的景气度还是会比较好,光伏还是高景气度行业,明年新增装机容量还是会有大的增长,所以就算市占率会下降一点,但是本身的业绩不会有下降。功率器件需求大幅提升也会增加半导体设备的需求。
12、销售费用率同比下降是怎么做到的?
答:研发投入占比及销售费用率有所下降,主要是新产品销售数量占比提升,主要是销售增长太快,所以占比下降了。人均销售157多万提升到200多万。
13、晶科最新组件是需要下一代设备还是原有设备改造?
答:都可以实现,就看客户选择,老的设备要看客户的机型,如果新建工厂会购置新机器,近1-2年的机型也可以改造,但是会有费用及时间的限制。看客户具体需求。
14、未来行业景气度有没有量化的数据?
答:组件端明年新增装机容量220GW预测,大约需要440GW组件产能,今年150GW新增装机容量(不一定实现),组件方向很多,对于设备替代速度也不一样。今年300GW产能可能有四分之一会被替换,所以明年大数来看新增140GW替换50GW产能总共190GW,市占率70%的话大概有130GW的市场份额。组件封装小线的建立会再增加10%-20%的销售。
15、单晶炉在N型有没有优势的地方?
答:N型和P型设备区别不大,主要考虑N型需求会更多,对于一个新人来说选择了这个方向。松瓷收购之前一直在研发N型,有2年的基础经验,所以对于这个方向的研发更好,产品更加稳定,技术基础更好。
16、客户端有哪些?
答:除了中环和隆基外都有接触。
17、电池片设备进展情况?
答:半导体和锂电项目都进入了立项和开发阶段。topcorn方向还没完全确定下来。明年可能还不一定能享受这个技术红利。
18、组件设备单线产能有多少?我们提供设备价值量?
答:提供3台串焊机或4台串焊机两种方案,产能在400-600M之间,一般客户端认为就是500M。3台设备的话:1台划片机300万,3台串焊机720-750,,3台排版机95万,一台叠焊机总共1000万-1100万。4台的话差不多增加280万左右。
19、topcorn和HJT招标体量有多少?组件上
答:很难回答,客户端没有公布。在谈的项目串焊机数量国内600台左右,海外还有80台,到明年一季度投产的数量。因为客户不会细说什么技术路线。
20、单晶炉提升市场份额策略?
答:自动化是优势,软控是否可以直接实现。减少对于人工的依赖。晶盛做的很优秀了,所以硬件上突破比较难,所以只能在软控上有所突破,未来引入大数据应用来体现优势。
21、半导体除了键合机还有很多封装设备,键合机占比20%左右,单一产品市场空间有限,有没有新的布局?交付期是多久?
答:键合机往前基本以进口设备为主,未来布局封测解决方案,装片机开发(冷机对应金铜线键合机也会开发),未来肯定是往键合机前端设备来开发。未来晶圆端设备还是会谨慎选择来开发。国外K&S交货期是在10个月左右,今年可能提高到6-8个月。我们控制在2个月左右。#股票##价值投资日志[超话]#

#余景天Tony[超话]# #正能量偶像余景天#

『粉狮日报』

2021年8月12日 周四

【数据站】
8.12每日任务https://t.cn/A6IceXUx

【控评站】
晨间任务https://t.cn/A6IVVyDQ
养铁任务https://t.cn/A6IVqZ3l
养耗任务https://t.cn/A6IVVg4S
艾漫新人https://t.cn/A6IVXOnW
FUNJIhttps://t.cn/A6IVKO8Q
回控https://t.cn/A6IVWC2N
时尚博https://t.cn/A6Ifz4mQ
七夕tuanjianhttps://t.cn/A6IffyQZ

【反黑站】
手动净化https://t.cn/A6IV6Xt2
日常净化https://t.cn/A6IfaUnG
反黑打卡https://t.cn/A6IVXu9r

【超管组】
8.12超话每日任务https://t.cn/A6IVKQBN

【网宣组】
8.12小宣每日任务https://t.cn/A6IVcjj7

【群管组】
官方&星球审核群https://t.cn/A6ccUAt9

————————————
八月公益https://t.cn/A6IcRK7I

@余景天-YJT


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 在全新DM-i超级混动技术加持下,可以说是能三过加油站而不入了[doge]#比亚迪秦L海豹06明日上市#预热了好两天,明天比亚迪又要整活了!明日上市的#比亚迪秦
  • 所以,过去的日子,就让它过去自己的人生不去经历怎么知道呢结果如何你努力过了又怎么会后悔呢这都是我的成长道路这个世上没有不带伤的人无论什么时候你都要相信真正能治
  • #刘宇宁开始推理吧#☀️#刘宇宁南珩离十六#☀️#摩登兄弟[超话]##刘宇宁天行健# | #刘宇宁卓不凡# | 努力向阳,靠近光,成为光。@摩登兄弟刘宇宁刘宇
  • “不……不是啊,” 林凯红着脸解释说:“她是我的小舅妈……” “你小舅妈真漂亮啊,当心,你的魂被她勾走了哟。我真是,我真的不 搞不懂我好迷,我尊重理解,但
  • ”记者:张宁宁(网络图片)#帝都王道[超话]# 《心魂》之 沧溟晨起 四十九 上回说到二人将身受重伤的忠离托付给村长家照料,立刻就回了竹影芦收拾行囊,柏麟背附
  • 去年的今天,月亮是弯弯的,我很想你。去年三月跟你去田里玩,你们在撒肥,我悄悄跟着翻垃圾桶的小猫玩去年四月又跟你去田里除草,别人把割掉的树枝扔在我家田里,后来请人
  • 展现自己的温柔和体贴,有可能会得到对方的青睐。事业学业你将会游刃有余地应对问题,无论是工作还是学业,都能够处理得当,展现出自己的优秀能力和应变能力。
  • 空间大方便又实用????赶紧入手吧??长22.5x高17.5x底12cm??6000000073 更多细节— BvNylonCassette(15格、超大号
  • 这边中国电动车企马上出海了,销量被群狼争抢不可避免,利润率再下降,这股价还得崩。这边中国电动车企马上出海了,销量被群狼争抢不可避免,利润率再下降,这股价还得崩。
  • 我们现在买到的VS PAM979,就是从这款黑乎乎的东西加工而来的,叫做碳纤维胚料。这里插一个小话题,有些朋友提过用3D打印技术造手表,效果会更好。
  • 希望升堂之后希望你可以记得我,不要忘记我,虽然你有很多的元气弹粉丝,我只是众多粉丝中不起眼的一个,我在以后会多去见你,会努力让你记住我的,集训期间,我可能得看着
  • #胡静怡Y[超话]##胡静怡百分百出品# #胡静怡 门面高音vocal#“砰 砰 砰爱意降临”维他命小兔乘坐丘比特的 来到你的身边️出现即被吸引的门面大主唱元气
  • 不过回头细想,出现这种情况无外乎几点原因:其一,赔偿机制缺失,因上市公司问题导致股票退市,损失的却是投资者,上市公司自然不着急;其二,处罚缺失,造成退市的原因是
  • #俄方将于5月举行战利品展览##俄方将展示缴获美英德法等国援乌装备#【俄媒提前曝光画面:俄军战利品展览多辆装备运抵莫斯科,现场挂多面印有“胜利”字样旗帜】综合俄
  • 2、景区里除了悬崖民宿,也有很多其他住处,可以方便第二天继续游玩 #微博影像年##家的美味自由角##带着微博去旅行##遇见美好##不止旅行##周末去哪儿##说走
  • 我的心很大,能容纳千万个二次元角色和三次元明星;我的心也很小,因为我只能装下,一个利莫里亚小海神​希望,明年甚至年年520,都有你(图源自截和微博,有侵权可私信
  • 五月Day14一眨眼,运动就断了超过一周[允悲]所幸,又重拾啦~中午晚上分别第一次试了站桩、八段锦,没想到站桩时间过得这么快,而且好像感觉能够快速恢复精力哎?八
  • 追剧日历主演张耀 / 楚月 / 徐志贤​​人一辈子,走走瞧瞧,吃吃喝喝,不生病,就是福气,如果能遇到自己爱的也爱自己的人,再发点小财,就是天大的福气。​​​虽然
  • 不过看着还是挺漂亮的 一些小小仪式感 那就同意他吧 其实原本有了结婚戒指配方我是想搞一个来着结果被抢先了完全没有想到他在做结婚戒指来着不过他送我了结婚戒指
  • #阳光信用[超话]##阳光信用 每日一善# 台北下了雪 你說那是保麗龍,耶誕夜的配色 也不配黃綠紅,叮叮噹 叮叮噹,聽到我的手機鈴聲 你別太緊張,聖誕夜驚魂 從