【#开源中文大模型仓库# 】本周新增
基础大模型:Yi-Base-6/34B、XVERSE-Base-65B、Nanbeige-Base-16B、LingoWhale-8B
领域基础大模型:Tongyi-Finance-Base-14B
对话大模型:Nanbeige-Chat-16B、OpenChat 3.5-7B、Tongyi-Finance-Chat-14B、Phind-34B、DeepSeek-Coder-1/7/33B。#开源##大模型#
Github:github.com/lonePatient/awesome-pretrained-chinese-nlp-models
基础大模型:Yi-Base-6/34B、XVERSE-Base-65B、Nanbeige-Base-16B、LingoWhale-8B
领域基础大模型:Tongyi-Finance-Base-14B
对话大模型:Nanbeige-Chat-16B、OpenChat 3.5-7B、Tongyi-Finance-Chat-14B、Phind-34B、DeepSeek-Coder-1/7/33B。#开源##大模型#
Github:github.com/lonePatient/awesome-pretrained-chinese-nlp-models
“深度求索”发布的开源代码大模型DeepSeek Coder,33B版的性能显着优于现有的开源代码 LLM。
地址:github.com/deepseek-ai/DeepSeek-Coder
DeepSeek Coder由一系列的代码语言模型组成,每个模型都是从头开始训练的,共包含2万亿标记,其中87%是代码,13%是自然语言,分别覆盖了英语和中文。我们提供不同规模的代码模型,从10亿到330亿标记不等。每个模型都经过预训练,使用16,000标记的窗口大小和额外的填空任务,以支持项目级别的代码补全和填充。在编码能力方面,DeepSeek Coder在多种编程语言和各种基准测试中都取得了开源代码模型的最先进性能。
地址:github.com/deepseek-ai/DeepSeek-Coder
DeepSeek Coder由一系列的代码语言模型组成,每个模型都是从头开始训练的,共包含2万亿标记,其中87%是代码,13%是自然语言,分别覆盖了英语和中文。我们提供不同规模的代码模型,从10亿到330亿标记不等。每个模型都经过预训练,使用16,000标记的窗口大小和额外的填空任务,以支持项目级别的代码补全和填充。在编码能力方面,DeepSeek Coder在多种编程语言和各种基准测试中都取得了开源代码模型的最先进性能。
【量化巨头发布第一代大模型:免费商用,完全开源】量化巨头幻方开发的大模型来了!11月2日晚间,幻方宣布,探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”在成立半年后,发布第一代大模型——开源代码大模型DeepSeek Coder,已经开放内测,免费商用,完全开源。
公告显示,DeepSeek Coder模型有指令Python快速写出程序、修改UI(用户界面)、测试bug(程序错误)以及数据分析,学写SQL(数据库语言)等技能。
在云算力端,目前国内只有商汤、百度、腾讯、字节、阿里和幻方有超过1万张A100芯片储备。 https://t.cn/A6WKTFOj
公告显示,DeepSeek Coder模型有指令Python快速写出程序、修改UI(用户界面)、测试bug(程序错误)以及数据分析,学写SQL(数据库语言)等技能。
在云算力端,目前国内只有商汤、百度、腾讯、字节、阿里和幻方有超过1万张A100芯片储备。 https://t.cn/A6WKTFOj
✋热门推荐