农历十一月初二,小雨。清晨醒来,看窗外,路面是湿漉漉的,小雨还在下,可惜不是雪。分享朋友的祝福:“11月你好,愿好运加满,坏运清零;生活甜甜,好运连连;想要的都拥有,得不到的都释怀;快乐相随,幸福相伴。”还有:“一片真诚,装在心底;一条微信,传达情意;一句关怀,真心实意;一声祝福,温暖心里;新的一天,万事如意。”从前天开始,准备把王宠的小楷珍品从头临一遍,装裱成长卷留给孩子们。第一篇是《南华真经》,现已临完《逍遥游》,《齐物论》刚开头。同时,开始读中华书局出的崔大华著《庄子歧解》,书中罗列了古贤对《庄子》的不同注疏,对比之下,诸家见解各有所长,真是不能只信一家之言。
#历史上的今天#
1408年12月14日,永乐大典成书。
《#永乐大典#》开始编纂是在明永乐元年(1403年)。那时,明成祖朱棣刚刚从他侄子建文帝手里夺来政权,为了表示讲修文治以笼络人心,遂命解缙等人编辑这部书。1404年编完,命名为《文献大成》。不久明成祖朱棣认为该书内容不够详备,不符修此书的原意,故而又增派太子少师姚广孝等参与,重新编修。这次参加编校、抄写的达2100多人,历时5年,于永乐六年即1408年12月14日完工,正文22877卷,凡例和目录60卷,总计近22900卷以上,装成11095册,总字数约3亿7千万字,赐名《永乐大典》。
该书为我国历史上前所未有的规模宏大的类书。采录曲集七、八千种,经、史、子、集、释、道、戏曲、平话、医卜、工技、农艺等各类著作无所不录,搜罗甚广,资料颇丰。
该书的体例是以明初官修的《洪武正韵》的韵部,依韵次编排辑录的资料。即:以单字为目,以韵系字,每单字下详注音、义,并录该字篆、隶、楷、草各种字体,然后分类辑入与该字有关即以该字起名的天文、地理、人事、名物、诗人词曲典故等各项内容。如《四库全书总目》所云:“或以一字一句分韵。或析取一篇,以篇名分韵。”“或”全录一书,以书名分韵。“大体符合凡例所说的”用韵以统字,用字以系事。“但《四库全书总目》认为它时以字句、时以篇名、时以书名分韵,“割裂庞杂、漫无条理”、“参差无绪”。
但是,该书采录古籍资料,书名、作者,都以红字写出,颇为醒目;成段成篇乃至全书引录文献,一字不易。尤其是元代以前的佚文秘典,世所不传的,全赖其全篇全书收入,甚为完整,保存了大量珍贵的古代文献资料,且出处明晰。清代乾隆年间编纂《四库全书》时,从中辑出的佚书甚多,已收入《四库全书》的就有:经部66种,史部41种,子部103种,集部175种,总计385种,4926卷。列入“存目”的还有100多部书。后来,还有人不断地从《永乐大典》这一古籍的“宝库”中辑录佚书佚文。足见《永乐大典》在保存古代文献资料方面的重大价值与贡献。
《永乐大典》只有抄本而无刻本。原本只抄一部,明世宗嘉靖年间又抄录正副两本,原本移回南京,正本存放于文渊阁,副本存放于皇史宬。明朝末年,原本、副本俱毁,仅存正本一部抄本。乾隆年间,已残缺不全,后英法联军、八国联军两次入侵北京,两次对此书抢劫、焚毁,光绪年间仅剩64册。后经多方搜求、各方捐赠、归还,再加上复制本,共得730余卷,1959年由中华书局影印出版,所印仅为原书的3%强。之后,中华书局又陆续收到60多卷,相继影印出版。
1408年12月14日,永乐大典成书。
《#永乐大典#》开始编纂是在明永乐元年(1403年)。那时,明成祖朱棣刚刚从他侄子建文帝手里夺来政权,为了表示讲修文治以笼络人心,遂命解缙等人编辑这部书。1404年编完,命名为《文献大成》。不久明成祖朱棣认为该书内容不够详备,不符修此书的原意,故而又增派太子少师姚广孝等参与,重新编修。这次参加编校、抄写的达2100多人,历时5年,于永乐六年即1408年12月14日完工,正文22877卷,凡例和目录60卷,总计近22900卷以上,装成11095册,总字数约3亿7千万字,赐名《永乐大典》。
该书为我国历史上前所未有的规模宏大的类书。采录曲集七、八千种,经、史、子、集、释、道、戏曲、平话、医卜、工技、农艺等各类著作无所不录,搜罗甚广,资料颇丰。
该书的体例是以明初官修的《洪武正韵》的韵部,依韵次编排辑录的资料。即:以单字为目,以韵系字,每单字下详注音、义,并录该字篆、隶、楷、草各种字体,然后分类辑入与该字有关即以该字起名的天文、地理、人事、名物、诗人词曲典故等各项内容。如《四库全书总目》所云:“或以一字一句分韵。或析取一篇,以篇名分韵。”“或”全录一书,以书名分韵。“大体符合凡例所说的”用韵以统字,用字以系事。“但《四库全书总目》认为它时以字句、时以篇名、时以书名分韵,“割裂庞杂、漫无条理”、“参差无绪”。
但是,该书采录古籍资料,书名、作者,都以红字写出,颇为醒目;成段成篇乃至全书引录文献,一字不易。尤其是元代以前的佚文秘典,世所不传的,全赖其全篇全书收入,甚为完整,保存了大量珍贵的古代文献资料,且出处明晰。清代乾隆年间编纂《四库全书》时,从中辑出的佚书甚多,已收入《四库全书》的就有:经部66种,史部41种,子部103种,集部175种,总计385种,4926卷。列入“存目”的还有100多部书。后来,还有人不断地从《永乐大典》这一古籍的“宝库”中辑录佚书佚文。足见《永乐大典》在保存古代文献资料方面的重大价值与贡献。
《永乐大典》只有抄本而无刻本。原本只抄一部,明世宗嘉靖年间又抄录正副两本,原本移回南京,正本存放于文渊阁,副本存放于皇史宬。明朝末年,原本、副本俱毁,仅存正本一部抄本。乾隆年间,已残缺不全,后英法联军、八国联军两次入侵北京,两次对此书抢劫、焚毁,光绪年间仅剩64册。后经多方搜求、各方捐赠、归还,再加上复制本,共得730余卷,1959年由中华书局影印出版,所印仅为原书的3%强。之后,中华书局又陆续收到60多卷,相继影印出版。
【#全国首个古籍大语言模型发布#:智能作诗、精确翻译、自动标点…】#全国首个古籍大语言模型名字叫荀子# 据南京农业大学网站消息,12月2日,该校信息管理科学系王东波教授研究团队在北京发布“荀子”古籍大语言模型。“荀子”古籍大语言模型是在国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”的支持下,联合中华书局古联公司推出的专门进行古籍处理与研究的智能工具。该模型包含《四库全书》在内的绝大多数传世古籍文献,拥有超过20亿字的大型语料库。
“荀子”古籍大语言模型以古籍智能化研究为目的,为古籍智能处理而设计,在推动我国古籍研究与保护工作创新发展、提高中华传统文化传承的效率与质量、实现大语言模型与古籍处理的深度融合上提供重要支撑。该模型作为开源公益研究成果已在GitHub、ModelScope等网站发布,用户可免费下载部署使用。
据介绍,王东波教授研究团队在南京农业大学高算力基础设施支持下,持续10年深耕古籍文献数字化研究,同时依托中华书局提供的应用场景,在古籍开源大语言模型上实现AI人工智能垂直细分领域的全国首创。
该开源模型包括两个部分:基座模型XunziALLM与对话模型XunziChat。
其模型亮点包括:智能标引,能够对古籍中的内容进行高质量主题标引,帮助研究人员快速了解文章主题;
信息抽取,能够自动从古籍中抽取关键信息,如人物、事件、地点等,大大节省了信息整理时间;
诗歌生成,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感;
高质量翻译,对于难以理解的古籍文献,能够进行精准的现代文翻译,帮助研究人员更好地理解原文含义;
阅读理解,能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读;
词法分析,可以完成古籍文本的自动分词和词性标注,有效提升研究效率;
自动标点,可以快速完成古籍文本的断句和标点,提升使用者对古籍文本的阅读体验。
此外,同时发布的基座模型,用户也可以根据自己的需求,使用本地的训练语料微调“荀子”基座模型,使其在古籍下游处理任务上取得更优越的处理性能。
“荀子”古籍大语言模型以古籍智能化研究为目的,为古籍智能处理而设计,在推动我国古籍研究与保护工作创新发展、提高中华传统文化传承的效率与质量、实现大语言模型与古籍处理的深度融合上提供重要支撑。该模型作为开源公益研究成果已在GitHub、ModelScope等网站发布,用户可免费下载部署使用。
据介绍,王东波教授研究团队在南京农业大学高算力基础设施支持下,持续10年深耕古籍文献数字化研究,同时依托中华书局提供的应用场景,在古籍开源大语言模型上实现AI人工智能垂直细分领域的全国首创。
该开源模型包括两个部分:基座模型XunziALLM与对话模型XunziChat。
其模型亮点包括:智能标引,能够对古籍中的内容进行高质量主题标引,帮助研究人员快速了解文章主题;
信息抽取,能够自动从古籍中抽取关键信息,如人物、事件、地点等,大大节省了信息整理时间;
诗歌生成,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感;
高质量翻译,对于难以理解的古籍文献,能够进行精准的现代文翻译,帮助研究人员更好地理解原文含义;
阅读理解,能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读;
词法分析,可以完成古籍文本的自动分词和词性标注,有效提升研究效率;
自动标点,可以快速完成古籍文本的断句和标点,提升使用者对古籍文本的阅读体验。
此外,同时发布的基座模型,用户也可以根据自己的需求,使用本地的训练语料微调“荀子”基座模型,使其在古籍下游处理任务上取得更优越的处理性能。
✋热门推荐