【提速100倍!新技术只要几分钟就能组装完整基因组】美国麻省理工学院和法国巴斯德研究所的科学家已经开发出一种在个人电脑上重建整个基因组(包括人类基因组)的技术。这种技术比目前最先进的方法快100倍,并仅使用1/5的资源。
9月14日,相关研究https://t.cn/A6MhGJN3发表于细胞出版社(Cell Press)旗下期刊Cell Systems。该技术使基因组数据的表达更紧凑,其灵感来源于为语言模型提供浓缩构建模块的是单词而非字母。
“我们可以在一台普通的笔记本电脑上迅速组装整个基因组和宏基因组,包括微生物基因组。”麻省理工学院计算机科学与人工智能实验室教授、论文作者Bonnie Berger说,“这种能力对于评估与疾病和细菌感染(如败血症)有关的肠道微生物群的变化至关重要,这样我们就可以更快地治疗疾病,拯救生命。”
自人类基因组计划以来,基因组组装领域已经取得了长足进展。经过了10多年的国际合作,2003年,人类基因组计划完成了第一个完整的人类基因组组装,耗资约27亿美元。
图:这张图片显示了661405个细菌基因组的部分图。来源:美国麻省理工学院等
虽然,目前人类基因组组装项目不再需要几年,但仍然需要几天时间和巨大的计算机能力。研究人员表示,第三代测序技术提供了数以万计碱基对的兆兆字节高质量基因组序列,但使用如此庞大的数据进行基因组组装具有挑战性。
目前的技术涉及对所有可能的读取结果进行配对比较,为了比目前技术更有效地实现基因组组装,Bruijn和同事将目光投向了语言模型。从de Bruijn图(一种用于基因组组装的简单、高效的数据结构)概念出发,研究人员开发了一种最小空间化的de Bruin图(mdBG),它使用了核苷酸短序列而不是单个核苷酸。
Bruijn说:“我们的mdBG只存储了总核苷酸的一小部分,同时保留了整个基因组结构,这使它们比经典de Bruijn图的效率高出几个数量级。”
研究人员用该方法收集了黑腹果蝇的高保真数据(几乎具有完美的单分子读取精度),以及太平洋生物科学公司提供的人类基因组数据。他们在评估所得基因组时发现,与其他基因组汇编器相比,基于mdBG的软件所需时间仅为1/33、随机存取内存为1/8。新软件组装高保真人类基因组数据,比Peregrine汇编器快81倍,内存使用量为1/18,比hifiasm汇编器快338倍,内存使用量为1/19。
接下来,研究人员建立了一个包含661406个细菌基因组的索引,这是迄今为止同类索引中规模最大的。他们发现,这种新技术可以在13分钟内搜索到所有的耐药基因,而使用标准序列比对需要7个小时。
Berger说:“我们知道该技术是有效的,但不知道在进一步优化代码后,它能在真实数据上扩展得如此好。”
巴斯德研究所研究员、该研究参与者之一的Rayan Chikhi说:“新技术不需要一些通常昂贵的预处理步骤,比如大多数基因组组装方法需要的错误校正。”
“我们还可以处理高达4%错误率的测序数据。”Berger补充说,“随着错误率不同的长读测序仪价格迅速下降,这种能力为测序数据分析大众化打开了大门。”
Berger指出,虽然该方法目前在处理太平洋生物科学公司高保真读数时表现最好(错误率远低于1%),但它可能很快就能与牛津纳米孔的超长读取兼容,目前牛津纳米孔的错误率为5%~12%,但很快能到达4%。
Berger说:“我们希望帮助科学家们建立快速的基因组检测站点,超越可能会忽略基因组之间重要差异的PCR和标记阵列。”https://t.cn/A6MhGJNu
9月14日,相关研究https://t.cn/A6MhGJN3发表于细胞出版社(Cell Press)旗下期刊Cell Systems。该技术使基因组数据的表达更紧凑,其灵感来源于为语言模型提供浓缩构建模块的是单词而非字母。
“我们可以在一台普通的笔记本电脑上迅速组装整个基因组和宏基因组,包括微生物基因组。”麻省理工学院计算机科学与人工智能实验室教授、论文作者Bonnie Berger说,“这种能力对于评估与疾病和细菌感染(如败血症)有关的肠道微生物群的变化至关重要,这样我们就可以更快地治疗疾病,拯救生命。”
自人类基因组计划以来,基因组组装领域已经取得了长足进展。经过了10多年的国际合作,2003年,人类基因组计划完成了第一个完整的人类基因组组装,耗资约27亿美元。
图:这张图片显示了661405个细菌基因组的部分图。来源:美国麻省理工学院等
虽然,目前人类基因组组装项目不再需要几年,但仍然需要几天时间和巨大的计算机能力。研究人员表示,第三代测序技术提供了数以万计碱基对的兆兆字节高质量基因组序列,但使用如此庞大的数据进行基因组组装具有挑战性。
目前的技术涉及对所有可能的读取结果进行配对比较,为了比目前技术更有效地实现基因组组装,Bruijn和同事将目光投向了语言模型。从de Bruijn图(一种用于基因组组装的简单、高效的数据结构)概念出发,研究人员开发了一种最小空间化的de Bruin图(mdBG),它使用了核苷酸短序列而不是单个核苷酸。
Bruijn说:“我们的mdBG只存储了总核苷酸的一小部分,同时保留了整个基因组结构,这使它们比经典de Bruijn图的效率高出几个数量级。”
研究人员用该方法收集了黑腹果蝇的高保真数据(几乎具有完美的单分子读取精度),以及太平洋生物科学公司提供的人类基因组数据。他们在评估所得基因组时发现,与其他基因组汇编器相比,基于mdBG的软件所需时间仅为1/33、随机存取内存为1/8。新软件组装高保真人类基因组数据,比Peregrine汇编器快81倍,内存使用量为1/18,比hifiasm汇编器快338倍,内存使用量为1/19。
接下来,研究人员建立了一个包含661406个细菌基因组的索引,这是迄今为止同类索引中规模最大的。他们发现,这种新技术可以在13分钟内搜索到所有的耐药基因,而使用标准序列比对需要7个小时。
Berger说:“我们知道该技术是有效的,但不知道在进一步优化代码后,它能在真实数据上扩展得如此好。”
巴斯德研究所研究员、该研究参与者之一的Rayan Chikhi说:“新技术不需要一些通常昂贵的预处理步骤,比如大多数基因组组装方法需要的错误校正。”
“我们还可以处理高达4%错误率的测序数据。”Berger补充说,“随着错误率不同的长读测序仪价格迅速下降,这种能力为测序数据分析大众化打开了大门。”
Berger指出,虽然该方法目前在处理太平洋生物科学公司高保真读数时表现最好(错误率远低于1%),但它可能很快就能与牛津纳米孔的超长读取兼容,目前牛津纳米孔的错误率为5%~12%,但很快能到达4%。
Berger说:“我们希望帮助科学家们建立快速的基因组检测站点,超越可能会忽略基因组之间重要差异的PCR和标记阵列。”https://t.cn/A6MhGJNu
【只要几分钟就能组装完整基因组】中国科学报:美国麻省理工学院和法国巴斯德研究所的科学家已经开发出一种在个人电脑上重建整个基因组(包括人类基因组)的技术。这种技术比目前最先进的方法快100倍,并仅使用1/5的资源。
9月14日,相关研究发表于细胞出版社(Cell Press)旗下期刊Cell Systems。该技术使基因组数据的表达更紧凑,其灵感来源于为语言模型提供浓缩构建模块的是单词而非字母。
“我们可以在一台普通的笔记本电脑上迅速组装整个基因组和宏基因组,包括微生物基因组。”麻省理工学院计算机科学与人工智能实验室教授、论文作者Bonnie Berger说,“这种能力对于评估与疾病和细菌感染(如败血症)有关的肠道微生物群的变化至关重要,这样我们就可以更快地治疗疾病,拯救生命。”
自人类基因组计划以来,基因组组装领域已经取得了长足进展。经过了10多年的国际合作,2003年,人类基因组计划完成了第一个完整的人类基因组组装,耗资约27亿美元。
虽然,目前人类基因组组装项目不再需要几年,但仍然需要几天时间和巨大的计算机能力。研究人员表示,第三代测序技术提供了数以万计碱基对的兆兆字节高质量基因组序列,但使用如此庞大的数据进行基因组组装具有挑战性。
目前的技术涉及对所有可能的读取结果进行配对比较,为了比目前技术更有效地实现基因组组装,Bruijn和同事将目光投向了语言模型。从de Bruijn图(一种用于基因组组装的简单、高效的数据结构)概念出发,研究人员开发了一种最小空间化的de Bruin图(mdBG),它使用了核苷酸短序列而不是单个核苷酸。
Bruijn说:“我们的mdBG只存储了总核苷酸的一小部分,同时保留了整个基因组结构,这使它们比经典de Bruijn图的效率高出几个数量级。”
研究人员用该方法收集了黑腹果蝇的高保真数据(几乎具有完美的单分子读取精度),以及太平洋生物科学公司提供的人类基因组数据。他们在评估所得基因组时发现,与其他基因组汇编器相比,基于mdBG的软件所需时间仅为1/33、随机存取内存为1/8。新软件组装高保真人类基因组数据,比Peregrine汇编器快81倍,内存使用量为1/18,比hifiasm汇编器快338倍,内存使用量为1/19。
接下来,研究人员建立了一个包含661406个细菌基因组的索引,这是迄今为止同类索引中规模最大的。他们发现,这种新技术可以在13分钟内搜索到所有的耐药基因,而使用标准序列比对需要7个小时。
Berger说:“我们知道该技术是有效的,但不知道在进一步优化代码后,它能在真实数据上扩展得如此好。”
巴斯德研究所研究员、该研究参与者之一的Rayan Chikhi说:“新技术不需要一些通常昂贵的预处理步骤,比如大多数基因组组装方法需要的错误校正。”
“我们还可以处理高达4%错误率的测序数据。”Berger补充说,“随着错误率不同的长读测序仪价格迅速下降,这种能力为测序数据分析大众化打开了大门。”
Berger指出,虽然该方法目前在处理太平洋生物科学公司高保真读数时表现最好(错误率远低于1%),但它可能很快就能与牛津纳米孔的超长读取兼容,目前牛津纳米孔的错误率为5%~12%,但很快能到达4%。
Berger说:“我们希望帮助科学家们建立快速的基因组检测站点,超越可能会忽略基因组之间重要差异的PCR和标记阵列。”
9月14日,相关研究发表于细胞出版社(Cell Press)旗下期刊Cell Systems。该技术使基因组数据的表达更紧凑,其灵感来源于为语言模型提供浓缩构建模块的是单词而非字母。
“我们可以在一台普通的笔记本电脑上迅速组装整个基因组和宏基因组,包括微生物基因组。”麻省理工学院计算机科学与人工智能实验室教授、论文作者Bonnie Berger说,“这种能力对于评估与疾病和细菌感染(如败血症)有关的肠道微生物群的变化至关重要,这样我们就可以更快地治疗疾病,拯救生命。”
自人类基因组计划以来,基因组组装领域已经取得了长足进展。经过了10多年的国际合作,2003年,人类基因组计划完成了第一个完整的人类基因组组装,耗资约27亿美元。
虽然,目前人类基因组组装项目不再需要几年,但仍然需要几天时间和巨大的计算机能力。研究人员表示,第三代测序技术提供了数以万计碱基对的兆兆字节高质量基因组序列,但使用如此庞大的数据进行基因组组装具有挑战性。
目前的技术涉及对所有可能的读取结果进行配对比较,为了比目前技术更有效地实现基因组组装,Bruijn和同事将目光投向了语言模型。从de Bruijn图(一种用于基因组组装的简单、高效的数据结构)概念出发,研究人员开发了一种最小空间化的de Bruin图(mdBG),它使用了核苷酸短序列而不是单个核苷酸。
Bruijn说:“我们的mdBG只存储了总核苷酸的一小部分,同时保留了整个基因组结构,这使它们比经典de Bruijn图的效率高出几个数量级。”
研究人员用该方法收集了黑腹果蝇的高保真数据(几乎具有完美的单分子读取精度),以及太平洋生物科学公司提供的人类基因组数据。他们在评估所得基因组时发现,与其他基因组汇编器相比,基于mdBG的软件所需时间仅为1/33、随机存取内存为1/8。新软件组装高保真人类基因组数据,比Peregrine汇编器快81倍,内存使用量为1/18,比hifiasm汇编器快338倍,内存使用量为1/19。
接下来,研究人员建立了一个包含661406个细菌基因组的索引,这是迄今为止同类索引中规模最大的。他们发现,这种新技术可以在13分钟内搜索到所有的耐药基因,而使用标准序列比对需要7个小时。
Berger说:“我们知道该技术是有效的,但不知道在进一步优化代码后,它能在真实数据上扩展得如此好。”
巴斯德研究所研究员、该研究参与者之一的Rayan Chikhi说:“新技术不需要一些通常昂贵的预处理步骤,比如大多数基因组组装方法需要的错误校正。”
“我们还可以处理高达4%错误率的测序数据。”Berger补充说,“随着错误率不同的长读测序仪价格迅速下降,这种能力为测序数据分析大众化打开了大门。”
Berger指出,虽然该方法目前在处理太平洋生物科学公司高保真读数时表现最好(错误率远低于1%),但它可能很快就能与牛津纳米孔的超长读取兼容,目前牛津纳米孔的错误率为5%~12%,但很快能到达4%。
Berger说:“我们希望帮助科学家们建立快速的基因组检测站点,超越可能会忽略基因组之间重要差异的PCR和标记阵列。”
【训练奶牛上厕所能减少氨排放】中国科学报:农场里,牛吃草时可以随意排泄,粪便的积累和扩散经常污染当地的土壤和水道。虽然,人们可以把牛关在牲口棚里,但在这些狭小空间里,它们的尿液和粪便会联合产生氨—— 一种间接的温室气体。
9月13日,在发表于细胞出版社(Cell Press)旗下期刊Current Biology(《当代生物学》)的一篇文章中,研究人员表示,如果奶牛可以学会“上厕所”,以便饲养者收集和处理粪便,就能减少空气污染,并创建更开放、对动物友好的农场。
“人们通常认为牛没有能力控制排便或排尿。”论文合著者、德国农场动物生物学研究所(FBN)动物心理学家Jan Langbein说。但他和团队质疑这种想法。“跟许多其他动物一样,牛非常聪明,它们能学会很多东西。那它们为何不能学会使用厕所呢?”
为了训练小牛如厕,Langbein研究小组与来自FBN、莱布尼兹老龄化研究所和新西兰奥克兰大学的科学家进行了研究,他们将这个过程称为MooLoo训练。一开始,当小牛在厕所小便时,他们奖励它们。然后当小牛需要排尿时,研究人员允许它们从外面接近厕所。
牛粪便中产生的氨不会直接导致气候变化,但当它到土壤中后,微生物会将其转化为一氧化二氮,这是仅次于甲烷和二氧化碳的第三重要温室气体。农业是氨排放的最大来源,其中畜牧业占了排放量的一半以上。
“你必须试着让动物参与到这个过程中,并训练它们遵循学到的东西。”Langbein说,“我们猜测可以训练这些动物,但能训练到什么程度,我们不知道。”
为了鼓励它们上厕所,研究人员希望让小牛把在厕所外小便和不愉快经历联系起来。“作为惩罚,我们首先使用入耳式耳机,每当它们在外面小便时,我们就播放非常难听的声音。”Langbein说,“我们认为这样做会惩罚动物,而且不会使它们太反感。最终能起到很好的威慑作用。”在几周里,研究小组成功地训练了16头小牛中的11头学会如厕。值得注意的是,犊牛表现出了与儿童相当的水平,并优于幼儿。
Langbein乐观地认为,通过更多训练,相关成功率可以进一步提高。“研究了牛10年、15年、20年,我们知道这些动物很有个性,它们能以不同的方式处理不同的事情。”既然,研究人员知道了如何训练奶牛如厕,他们想把该研究成果应用到真正的养殖场和户外系统中。Langbein希望“几年后所有的奶牛都能自己上厕所”。
9月13日,在发表于细胞出版社(Cell Press)旗下期刊Current Biology(《当代生物学》)的一篇文章中,研究人员表示,如果奶牛可以学会“上厕所”,以便饲养者收集和处理粪便,就能减少空气污染,并创建更开放、对动物友好的农场。
“人们通常认为牛没有能力控制排便或排尿。”论文合著者、德国农场动物生物学研究所(FBN)动物心理学家Jan Langbein说。但他和团队质疑这种想法。“跟许多其他动物一样,牛非常聪明,它们能学会很多东西。那它们为何不能学会使用厕所呢?”
为了训练小牛如厕,Langbein研究小组与来自FBN、莱布尼兹老龄化研究所和新西兰奥克兰大学的科学家进行了研究,他们将这个过程称为MooLoo训练。一开始,当小牛在厕所小便时,他们奖励它们。然后当小牛需要排尿时,研究人员允许它们从外面接近厕所。
牛粪便中产生的氨不会直接导致气候变化,但当它到土壤中后,微生物会将其转化为一氧化二氮,这是仅次于甲烷和二氧化碳的第三重要温室气体。农业是氨排放的最大来源,其中畜牧业占了排放量的一半以上。
“你必须试着让动物参与到这个过程中,并训练它们遵循学到的东西。”Langbein说,“我们猜测可以训练这些动物,但能训练到什么程度,我们不知道。”
为了鼓励它们上厕所,研究人员希望让小牛把在厕所外小便和不愉快经历联系起来。“作为惩罚,我们首先使用入耳式耳机,每当它们在外面小便时,我们就播放非常难听的声音。”Langbein说,“我们认为这样做会惩罚动物,而且不会使它们太反感。最终能起到很好的威慑作用。”在几周里,研究小组成功地训练了16头小牛中的11头学会如厕。值得注意的是,犊牛表现出了与儿童相当的水平,并优于幼儿。
Langbein乐观地认为,通过更多训练,相关成功率可以进一步提高。“研究了牛10年、15年、20年,我们知道这些动物很有个性,它们能以不同的方式处理不同的事情。”既然,研究人员知道了如何训练奶牛如厕,他们想把该研究成果应用到真正的养殖场和户外系统中。Langbein希望“几年后所有的奶牛都能自己上厕所”。
✋热门推荐