#全面的中文大语言模型评测#
https://t.cn/A6WLUUBf
近日,EMNLP 2023的论文结果公布。来自香港中文大学计算机科学与工程学系的王历伟助理教授研究团队的CLEVA: Chinese Language Models EVAluation Platform 被EMNLP 2023 System Demonstrations 录取。
据CLEVA项目负责人王历伟教授介绍,CLEVA是其带领的港中文语言和视觉实验室(CUHK LaVi Lab)联合上海人工智能实验室合作研究的全面的中文大语言模型评测方法。
指标上,CLEVA不仅关注过往评测中大家最在乎的准确性(Accuracy),还借鉴了HELM在英文评测中的做法,针对中文评测设计了鲁棒性(Robustness)、公平性(Fairness)、效率(Efficiency)、校准与不确定性(Calibration and Uncertainty)、偏见与刻板印象(Bias and Stereotypes)和毒性(Toxicity)的指标。另外,CLEVA还引入了多样性(Diversity)和隐私性(Privacy)评测,帮助人们做出综合的判断。这对大模型应用至关重要。
https://t.cn/A6WLUUBf
近日,EMNLP 2023的论文结果公布。来自香港中文大学计算机科学与工程学系的王历伟助理教授研究团队的CLEVA: Chinese Language Models EVAluation Platform 被EMNLP 2023 System Demonstrations 录取。
据CLEVA项目负责人王历伟教授介绍,CLEVA是其带领的港中文语言和视觉实验室(CUHK LaVi Lab)联合上海人工智能实验室合作研究的全面的中文大语言模型评测方法。
指标上,CLEVA不仅关注过往评测中大家最在乎的准确性(Accuracy),还借鉴了HELM在英文评测中的做法,针对中文评测设计了鲁棒性(Robustness)、公平性(Fairness)、效率(Efficiency)、校准与不确定性(Calibration and Uncertainty)、偏见与刻板印象(Bias and Stereotypes)和毒性(Toxicity)的指标。另外,CLEVA还引入了多样性(Diversity)和隐私性(Privacy)评测,帮助人们做出综合的判断。这对大模型应用至关重要。
拍2件到手44.8元
先领79-30券:https://t.cn/A6Ww8M1N
再领39-5补贴券:https://t.cn/A6WwHiLn
Lavi 儿童加绒打底衫
https://t.cn/A6Ww8xvo
拍下59.9元
79-10券https://t.cn/A6WwHiLn
迪士尼 儿童羽绒马甲
https://t.cn/A6Ww8x2Z
拍下39.9元
先领39-5补贴券https://t.cn/A6WwHiLn
迪士尼 儿童纯棉内裤4条装
https://t.cn/A6Oeqoqq
先领79-30券:https://t.cn/A6Ww8M1N
再领39-5补贴券:https://t.cn/A6WwHiLn
Lavi 儿童加绒打底衫
https://t.cn/A6Ww8xvo
拍下59.9元
79-10券https://t.cn/A6WwHiLn
迪士尼 儿童羽绒马甲
https://t.cn/A6Ww8x2Z
拍下39.9元
先领39-5补贴券https://t.cn/A6WwHiLn
迪士尼 儿童纯棉内裤4条装
https://t.cn/A6Oeqoqq
拍2件到手44.8元
先领79-30券:https://t.cn/A6Ww8M1N
再领39-5补贴券:https://t.cn/A6WwHiLn
Lavi 儿童加绒打底衫
https://t.cn/A6Ww8xvo
拍下59.9元
79-10券https://t.cn/A6WwHiLn
迪士尼 儿童羽绒马甲
https://t.cn/A6Ww8x2Z
拍下39.9元
先领39-5补贴券https://t.cn/A6WwHiLn
迪士尼 儿童纯棉内裤4条装
https://t.cn/A6Oeqoqq
先领79-30券:https://t.cn/A6Ww8M1N
再领39-5补贴券:https://t.cn/A6WwHiLn
Lavi 儿童加绒打底衫
https://t.cn/A6Ww8xvo
拍下59.9元
79-10券https://t.cn/A6WwHiLn
迪士尼 儿童羽绒马甲
https://t.cn/A6Ww8x2Z
拍下39.9元
先领39-5补贴券https://t.cn/A6WwHiLn
迪士尼 儿童纯棉内裤4条装
https://t.cn/A6Oeqoqq
✋热门推荐