农历十一月初二,小雨。清晨醒来,看窗外,路面是湿漉漉的,小雨还在下,可惜不是雪。分享朋友的祝福:“11月你好,愿好运加满,坏运清零;生活甜甜,好运连连;想要的都拥有,得不到的都释怀;快乐相随,幸福相伴。”还有:“一片真诚,装在心底;一条微信,传达情意;一句关怀,真心实意;一声祝福,温暖心里;新的一天,万事如意。”从前天开始,准备把王宠的小楷珍品从头临一遍,装裱成长卷留给孩子们。第一篇是《南华真经》,现已临完《逍遥游》,《齐物论》刚开头。同时,开始读中华书局出的崔大华著《庄子歧解》,书中罗列了古贤对《庄子》的不同注疏,对比之下,诸家见解各有所长,真是不能只信一家之言。

#历史上的今天#
1408年12月14日,永乐大典成书。
《#永乐大典#》开始编纂是在明永乐元年(1403年)。那时,明成祖朱棣刚刚从他侄子建文帝手里夺来政权,为了表示讲修文治以笼络人心,遂命解缙等人编辑这部书。1404年编完,命名为《文献大成》。不久明成祖朱棣认为该书内容不够详备,不符修此书的原意,故而又增派太子少师姚广孝等参与,重新编修。这次参加编校、抄写的达2100多人,历时5年,于永乐六年即1408年12月14日完工,正文22877卷,凡例和目录60卷,总计近22900卷以上,装成11095册,总字数约3亿7千万字,赐名《永乐大典》。
该书为我国历史上前所未有的规模宏大的类书。采录曲集七、八千种,经、史、子、集、释、道、戏曲、平话、医卜、工技、农艺等各类著作无所不录,搜罗甚广,资料颇丰。
该书的体例是以明初官修的《洪武正韵》的韵部,依韵次编排辑录的资料。即:以单字为目,以韵系字,每单字下详注音、义,并录该字篆、隶、楷、草各种字体,然后分类辑入与该字有关即以该字起名的天文、地理、人事、名物、诗人词曲典故等各项内容。如《四库全书总目》所云:“或以一字一句分韵。或析取一篇,以篇名分韵。”“或”全录一书,以书名分韵。“大体符合凡例所说的”用韵以统字,用字以系事。“但《四库全书总目》认为它时以字句、时以篇名、时以书名分韵,“割裂庞杂、漫无条理”、“参差无绪”。
但是,该书采录古籍资料,书名、作者,都以红字写出,颇为醒目;成段成篇乃至全书引录文献,一字不易。尤其是元代以前的佚文秘典,世所不传的,全赖其全篇全书收入,甚为完整,保存了大量珍贵的古代文献资料,且出处明晰。清代乾隆年间编纂《四库全书》时,从中辑出的佚书甚多,已收入《四库全书》的就有:经部66种,史部41种,子部103种,集部175种,总计385种,4926卷。列入“存目”的还有100多部书。后来,还有人不断地从《永乐大典》这一古籍的“宝库”中辑录佚书佚文。足见《永乐大典》在保存古代文献资料方面的重大价值与贡献。
《永乐大典》只有抄本而无刻本。原本只抄一部,明世宗嘉靖年间又抄录正副两本,原本移回南京,正本存放于文渊阁,副本存放于皇史宬。明朝末年,原本、副本俱毁,仅存正本一部抄本。乾隆年间,已残缺不全,后英法联军、八国联军两次入侵北京,两次对此书抢劫、焚毁,光绪年间仅剩64册。后经多方搜求、各方捐赠、归还,再加上复制本,共得730余卷,1959年由中华书局影印出版,所印仅为原书的3%强。之后,中华书局又陆续收到60多卷,相继影印出版。

【#全国首个古籍大语言模型发布#:智能作诗、精确翻译、自动标点…】#全国首个古籍大语言模型名字叫荀子# 据南京农业大学网站消息,12月2日,该校信息管理科学系王东波教授研究团队在北京发布“荀子”古籍大语言模型。“荀子”古籍大语言模型是在国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”的支持下,联合中华书局古联公司推出的专门进行古籍处理与研究的智能工具。该模型包含《四库全书》在内的绝大多数传世古籍文献,拥有超过20亿字的大型语料库。

“荀子”古籍大语言模型以古籍智能化研究为目的,为古籍智能处理而设计,在推动我国古籍研究与保护工作创新发展、提高中华传统文化传承的效率与质量、实现大语言模型与古籍处理的深度融合上提供重要支撑。该模型作为开源公益研究成果已在GitHub、ModelScope等网站发布,用户可免费下载部署使用。

据介绍,王东波教授研究团队在南京农业大学高算力基础设施支持下,持续10年深耕古籍文献数字化研究,同时依托中华书局提供的应用场景,在古籍开源大语言模型上实现AI人工智能垂直细分领域的全国首创。

该开源模型包括两个部分:基座模型XunziALLM与对话模型XunziChat。

其模型亮点包括:智能标引,能够对古籍中的内容进行高质量主题标引,帮助研究人员快速了解文章主题;

信息抽取,能够自动从古籍中抽取关键信息,如人物、事件、地点等,大大节省了信息整理时间;

诗歌生成,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感;

高质量翻译,对于难以理解的古籍文献,能够进行精准的现代文翻译,帮助研究人员更好地理解原文含义;

阅读理解,能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读;

词法分析,可以完成古籍文本的自动分词和词性标注,有效提升研究效率;

自动标点,可以快速完成古籍文本的断句和标点,提升使用者对古籍文本的阅读体验。

此外,同时发布的基座模型,用户也可以根据自己的需求,使用本地的训练语料微调“荀子”基座模型,使其在古籍下游处理任务上取得更优越的处理性能。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 我想和李冰洁@_李冰洁-fighting 说,有梦想的人真的了不起,一战成名“腾空出世”的时候我在,破亚洲纪录的时候我在,低谷的时候我在,恢复成绩的时候我在,破
  • 原‮,来‬是一枚执业中‮师药‬,难怪了,职业‮色本‬使然,研究‮,后‬她说,易‮灸灸‬出的‮西东‬,果然全都真材‮料实‬。今年开始认识了可以提供印花面料的面料供
  • 对于分手后,还放不下的人来说,最困扰他们的无非两点:他还能挽回吗?”弄清楚你们分手的真正原因,让对方下狠心离开你的原因又是什么。
  • 我妈把他们放到笼子里,喂他们水和地瓜,小豆包缩在一角,小土豆只喝了点水,只有傻乎乎的小海盗大吃大喝[允悲]可惜我还没见到,明天就可以摸摸他们了[哇]#宋嘟嘟&a
  • 在人生的旅程中,每个人的生活都离不开别人的帮助,因为自然界的任何事物都是一个普遍联系的整体,没有谁能够脱离周围的事物而孤立地存在,但在接受别人帮助的同时,我们也
  • #2022倒数100天# 9/25 Day ❷每日重要三件事:⒈看《典籍里的中国》⒉读完《大森林里的小木屋》⒊深度陪伴,去公园“向上生活组成”清单✔早睡,10
  • 拿下秋招第一个offer我爱深圳教育❤️很突然 自己都还没反应过来[泪][泪]感谢各位指导与帮助我的老师和师兄师姐们~从暑假开始准备简历 师兄跟我们分享上岸经验
  • 究其原因就是不会区分强弱,只会简单看价格高低,而且这还是大多数散户朋友的一个通病,总是想要一个固定的指标或者标准来横盘是否突破,是否上涨,是否见底,结果就是理想
  • 近日,海外媒体绘制了一组假想图,并暗示其车身尺寸或有所加大,或将成为MINI CLUBMAN的继任者,与大众高尔夫竞争。MINI计划推出全新车型】今年2月,MI
  • (没好意思说她也有很大问题)她:哎呦我不是觉得我为人家付出的少吗,想问问你我该怎么做我:那你以后别跟其他男的去酒吧了也别撒谎了,他也不许再老挑你毛病这不如前任那
  • 在空间上无限,时间上永恒的宇宙中,我们的一生犹如在一颗尘埃上的刹那。 相遇、相知、相爱、生命短暂的可能连好好道别都来不及,还有什么不能包容的? 每一个生命都应该
  • 供奉白龙王‮令可‬自身前程似锦、走出低迷时期‮过跨‬命理坎坷、令‮运鸿‬当头,一切‮情事‬都可顺风顺水‮禄福‬寿傍身,破‮年流‬不利 运‮不势‬济 绝地反击 提
  • 新一告诉记者,此次邯郸“寻谣计划”主要想搜集直接能提供有旋律的老童谣;65岁以上的老人童年的歌曲;有旋律但在网上找不到的民间歌谣。从2018年到2020年夏,小
  • ”我睁开大眼睛想也不想的脱口而出,“不对,你看这树,这草还有这些花朵在阳光的沐浴下都努力的生长着,诺,你再看看,头顶上的小鸟们在欢快的歌唱着,这一切都是一些简单
  • “利居·龙湾庄园”和“金水花园”两个项目的建成,极大地提高了我街道小城街道化建设的进程,改善了人居环境,拉动了地方经济增长,彰显着我街道建设的显著成果。超前谋划
  • #皮肤科黄硕医生##青年美医进阶计划#   天凉了,这对不少宝宝来说是件极好的事情,但有一部分宝宝又开始苦恼了,因为换季一到,就意味着敏感肌又要“遭殃”了。只要
  • 推介会现场,产品讲师也向来宾“沉浸式”地讲解了该车型从前端开发,到后期享有的各项服务保障,助推区域营销扩大战果。  10月12日、10月13日,解放经销商新乡元
  • 你的妻子心不安,家财不安,外财怎么敢进你的家呢? ​​​ ​​​​#婚姻感情# #事业财运# #健康问题# #起名改名、事业财运、奇门遁甲测事寻物#内调外养是每
  • 灵感曾经召唤我,信手泼墨挥毫,不断地画着:“深秋荷花应消魂,瑞莲池塘羞黄昏,”也画过,“抱月亭台与君共,月华升,你说消魂不消魂。常言道:“诗情画意”让人心醉,心
  • 李老汉太可怜了,它不仅要帮老婆拿东西,还被老婆捉弄经历了一次李李尴尬,哈哈哈我们去的健身房是要刷指纹进出的,然后他刷了他的指纹,我蹭的一下迅雷不及掩耳之势就跑了