这个研究有点不寻常,但是有时候可能也挺有用的

LLM4Decompile: Decompiling Binary Code with Large Language Models(使用大型语言模型反编译二进制代码)#ai#

- LLM4Decompile是致力于反编译的开创性开源大型语言模型。其当前版本支持将 Linux x86_64 二进制文件(从 GCC 的 O0 到 O3 优化级别)反编译为人类可读的 C 源代码。该项目组致力于扩展该工具的功能,并不断努力纳入更广泛的架构和配置。
- HumanEval-Decompile是第一个反编译基准测试,重点评估反编译代码的可重新执行性方面。它是 HumanEval 数据集的 C 语言改编版,提供了一套 C 解决方案和断言来评估反编译代码的实际效用。

论文:arxiv.org/abs/2403.05286v1
项目:github.com/albertan017/LLM4Decompile

论文摘要:
反编译的目的是将编译后的代码恢复为人类可读的源代码,但在名称和结构等细节上遇到了困难。大型语言模型 (LLM) 显示了编程任务的前景,激励其应用程序进行反编译。然而,不存在任何用于反编译的开源LLM。而且,现有的反编译评估系统主要考虑token级别的准确性,很大程度上忽略了代码的可执行性,而这是任何程序最重要的特征。

因此,我们发布了第一个开放获取的反编译LLM,范围从1B到33B,在40亿个C源代码和相应的汇编代码上进行了预训练。开源LLM可以作为该领域进一步发展的基准。

为了确保程序评估的实用性,我们引入了 Decompile-Eval,这是第一个考虑反编译可重编译性和可重执行性的数据集。该基准强调了从程序语义角度评估反编译模型的重要性。实验表明,我们的LLM4Decompile能够准确反编译21%的汇编代码,比GPT-4提高了50%。

#ChatGPT[超话]#

嗯,老夫从后端一路干到前端。
来到日本之后,人家看我之前写代码写的比较多。。。
居然让我干起了运维[允悲]
vba也会时不时的学一下[允悲]
对对,还有Excel的公式[允悲]
换一个项目就换一个语言的诅咒再次发威,都不带重样的[允悲]

平时工作中用linux的shell,
但是我最近觉得windows的powershell比较有趣,
虽然工作中用不到,但还是学起来[二哈]
暇つぶしとして実行するんだよ[二哈]

我试了下微软的 Redis 替代品 Garnet。测试确实如宣传的那样,可以兼容各种 RESP 客户端。而且它是完全基于 Csharp+.NET8 的,自然还继承了它的一些特色:
- 速度和 Redis 几乎不相上下,运行很稳定
- 自行编译变得非常简单,只要安装.NET SDK,一个命令就能编译完成
- 除了 Linux/macOS 外,还原生支持 Windows Server(包括 Server Core 和 NanoServer)

由于官方没有提供 Windows 系统的 docker 镜像,所以我自己搭了一套 CI 流水线,很容易就编译出了一份能够运行在 Windows NanoServer 2022 上的 Garnet 镜像

当然,问题也是有的,就是 Garnet 现在(并且将来也)不支持 Lua 脚本。现在很多系统内分布式锁/事务的已有代码都用来 Lua 来实现,它们并没法无痛迁移到 Garnet。
幸好我自己的项目里并没有这些,都是拿 redis 当缓存和简单的锁来用的,服务器也是Win Server,用 Garnet 替换云上的 redis 其实是比较好的选择。

还有个问题就是当前 .NET 8 里面 IDistributedCache 的 Redis 实现内部用了 Lua 脚本(每一个 Cache 都对应了一个 hash set:图1),导致 asp.net redis 分布式缓存现在是用不了 garnet 的,调用分布式缓存组件就会报错。

所以 Garnet 的开发者跑去给 aspnet 的仓库提了个PR(图2),修改了这部分实现,改成用原生 RESP 命令的方式,已经合并到主分支了。从 .NET9 preview4 开始,Microsoft.Extensions.Caching.StackExchangeRedis 包就可以支持 garnet 了。

我看了下PR里的代码,新的实现其实并没有实现之前 lua 版本的原子性(在原子操作中修改值+延长过期时间),但好在在这个场景下,TTL 只会增加,即使遇到了竞争/多线程的情况,多执行几次也不会出现什么问题(在极短时间内,两次设置 Expire 到同一个时间,应该不是问题吧)。所以问题解决~


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 比方说,你可以告诉他:“我不是故意要忽略你,而是我不管和家里人还是朋友,都会经常开玩笑互怼,所以没有意识到这件事对你有多重要(认可他的情绪)对不起”。展现给他,
  • 但他们中的谁都承受不住那种要求,狮子觉得不体面伤自尊,双子觉得逾矩了,不舒服。好像不用再有伪装,对方就能轻易伴在左右,容纳脆弱的自己,惺惺相惜坦然自在。
  • 昨晚我们努力在回忆十天的假期都干了些什么,赤壁玩了两天:古战场、羊楼洞、万亩茶园,然后体检,搬家,美容科看痣。羊楼洞,一个方圆不过0.4平方公里的偏僻小镇,却曾
  • #恋爱时间越久越容易分手吗# #错误时间遇对的人是遗憾吗#虽然开着暖气睡一头大汗 关掉暖气就半夜冻醒虽然这三天吃的极其敷衍 每天早早就犯困虽然刚到宿舍变成一个人
  • 陈哲远,很高兴认识你,未来的日子,我们一起并肩走下去吧,加油哦! @陈哲远-#陈哲远1029生日快乐# 其实在小祖宗时期就认识到了你,可以说是成为了你的路人粉,
  • 这台光刻机特别有意思,是用投影仪进行改装的,然后安装在显微镜上就形成了简单的光刻机,不得不佩服这个脑洞确实牛!但如果只是做个简单点的芯片,就不要这么多设备。
  • #昕羊[超话]# #信仰不殆 战至天光# 热血难凉,艰辛自知所谓的躺赢,逃不脱一次又一次几近崩盘后仍在坚守所谓的保送,避不开一遍又一遍考量后做的谨慎选择我们一向
  • 可以TO签,to签要求是五个字以内,请大家提前把to签内容编辑进手机备忘录里~9.应援礼包怎么购买?如有食品49-20券刺猬阿甘 南瓜酥 75g*1袋,买9件9
  • 做一个没心没肺的人何其幸运,我也想做一个酷盖,你爱怎样怎样,我不会揪心的疼,我不会扑簌簌地掉眼泪,明明自己也委屈,可还要装作大度一点,我不是啊,我想要被你时刻关
  • 你买的是我的娃,不是我的人和什么人设,关注我,随时可能塌房,因为我就是个抠jio女大学生,然后天天喜欢当素质女青,激情❤️‍喷子。4.关于我:哈哈我在现实中比较
  • 【在湖冰制成的圆盘上享受夕张冬天的魅力,冰盘旋转木马1月末在Shuparo湖上登场】1月28日至30日,在夕张市的Shuparo湖举办了一场名为“冰盘旋转木马(
  • 白羊座♈ 福气暴涨,吉星坐镇金牛座♉ 贵人相伴,财运飙升双子座♊ 万事称心,大喜缠身巨蟹座♋ 好运缠身,转运重生狮子座♌ 锦鲤伴身,好运满满处女座♍ 花开富贵,
  • 御神明而势事,分毫无漏息。御神明而势事,分毫无漏息。
  • 图6是她近两年坚持跳舞的变化,整个人更紧致了。2022.10.15《小姐好白》因为插曲而去看的电影,但是很惊喜,一步喜剧片能让人一直捧腹大笑而不总是用烂梗就够了
  • #默默无闻的清道夫[超话]##笑眼狗狗朴志焄##欢脱小狗朴志焄# •朴志焄•宝石盒队长&领唱&领舞✔️队内业先锋那个三点钟消失的男人‍♂️煮面豆官方认证“始终如
  • 1Y360D&D35弟弟昨天称重11.8斤[污]今天是我和二胖的二人世界,感慨一个人带娃的惬意心情,安静了一整天,晚上二胖把臭臭拉我睡裤上了,阔别了一年
  • 叮~按时长大 2020.03.10 二月十七有配图有文案祝我本命年生日快乐希望父母以及家人朋友身体健康平安喜乐❤️希望2020“所行皆所愿,所愿归坦途”。 ♡
  • p7是翟某人在我刚到的挂耳上画的大作只能说 翟大师真是太有绘画的天赋了 随手画几笔就画出了☀️ 和她自己 牛爱吃牛肉面,从来觉得早上不吃碗牛肉面就不是一天的
  • 其实我也用了很多美白精华,很多很多都不适合痘皮去使用,用了之后就会出现皮肤不稳定大面积爆痘的情况发生,但嫒碧知这款不仅仅没有让我皮肤出现问题,并且感觉一天比一天
  • #王奕[超话]#[憧憬]#王奕颜值牛逼症# 全家桶不够吃?那是小鸡整个家庭都在那桶里,你不在乎,你只在乎 【❤️王奕❤️全团涨粉趋势第一名翩翩公子《古画》⛰️异