【提速100倍!新技术只要几分钟就能组装完整基因组】美国麻省理工学院和法国巴斯德研究所的科学家已经开发出一种在个人电脑上重建整个基因组(包括人类基因组)的技术。这种技术比目前最先进的方法快100倍,并仅使用1/5的资源。

9月14日,相关研究https://t.cn/A6MhGJN3发表于细胞出版社(Cell Press)旗下期刊Cell Systems。该技术使基因组数据的表达更紧凑,其灵感来源于为语言模型提供浓缩构建模块的是单词而非字母。

“我们可以在一台普通的笔记本电脑上迅速组装整个基因组和宏基因组,包括微生物基因组。”麻省理工学院计算机科学与人工智能实验室教授、论文作者Bonnie Berger说,“这种能力对于评估与疾病和细菌感染(如败血症)有关的肠道微生物群的变化至关重要,这样我们就可以更快地治疗疾病,拯救生命。”

自人类基因组计划以来,基因组组装领域已经取得了长足进展。经过了10多年的国际合作,2003年,人类基因组计划完成了第一个完整的人类基因组组装,耗资约27亿美元。

图:这张图片显示了661405个细菌基因组的部分图。来源:美国麻省理工学院等

虽然,目前人类基因组组装项目不再需要几年,但仍然需要几天时间和巨大的计算机能力。研究人员表示,第三代测序技术提供了数以万计碱基对的兆兆字节高质量基因组序列,但使用如此庞大的数据进行基因组组装具有挑战性。

目前的技术涉及对所有可能的读取结果进行配对比较,为了比目前技术更有效地实现基因组组装,Bruijn和同事将目光投向了语言模型。从de Bruijn图(一种用于基因组组装的简单、高效的数据结构)概念出发,研究人员开发了一种最小空间化的de Bruin图(mdBG),它使用了核苷酸短序列而不是单个核苷酸。

Bruijn说:“我们的mdBG只存储了总核苷酸的一小部分,同时保留了整个基因组结构,这使它们比经典de Bruijn图的效率高出几个数量级。”

研究人员用该方法收集了黑腹果蝇的高保真数据(几乎具有完美的单分子读取精度),以及太平洋生物科学公司提供的人类基因组数据。他们在评估所得基因组时发现,与其他基因组汇编器相比,基于mdBG的软件所需时间仅为1/33、随机存取内存为1/8。新软件组装高保真人类基因组数据,比Peregrine汇编器快81倍,内存使用量为1/18,比hifiasm汇编器快338倍,内存使用量为1/19。

接下来,研究人员建立了一个包含661406个细菌基因组的索引,这是迄今为止同类索引中规模最大的。他们发现,这种新技术可以在13分钟内搜索到所有的耐药基因,而使用标准序列比对需要7个小时。

Berger说:“我们知道该技术是有效的,但不知道在进一步优化代码后,它能在真实数据上扩展得如此好。”

巴斯德研究所研究员、该研究参与者之一的Rayan Chikhi说:“新技术不需要一些通常昂贵的预处理步骤,比如大多数基因组组装方法需要的错误校正。”

“我们还可以处理高达4%错误率的测序数据。”Berger补充说,“随着错误率不同的长读测序仪价格迅速下降,这种能力为测序数据分析大众化打开了大门。”

Berger指出,虽然该方法目前在处理太平洋生物科学公司高保真读数时表现最好(错误率远低于1%),但它可能很快就能与牛津纳米孔的超长读取兼容,目前牛津纳米孔的错误率为5%~12%,但很快能到达4%。

Berger说:“我们希望帮助科学家们建立快速的基因组检测站点,超越可能会忽略基因组之间重要差异的PCR和标记阵列。”https://t.cn/A6MhGJNu

【只要几分钟就能组装完整基因组】中国科学报:美国麻省理工学院和法国巴斯德研究所的科学家已经开发出一种在个人电脑上重建整个基因组(包括人类基因组)的技术。这种技术比目前最先进的方法快100倍,并仅使用1/5的资源。

9月14日,相关研究发表于细胞出版社(Cell Press)旗下期刊Cell Systems。该技术使基因组数据的表达更紧凑,其灵感来源于为语言模型提供浓缩构建模块的是单词而非字母。

“我们可以在一台普通的笔记本电脑上迅速组装整个基因组和宏基因组,包括微生物基因组。”麻省理工学院计算机科学与人工智能实验室教授、论文作者Bonnie Berger说,“这种能力对于评估与疾病和细菌感染(如败血症)有关的肠道微生物群的变化至关重要,这样我们就可以更快地治疗疾病,拯救生命。”

自人类基因组计划以来,基因组组装领域已经取得了长足进展。经过了10多年的国际合作,2003年,人类基因组计划完成了第一个完整的人类基因组组装,耗资约27亿美元。

虽然,目前人类基因组组装项目不再需要几年,但仍然需要几天时间和巨大的计算机能力。研究人员表示,第三代测序技术提供了数以万计碱基对的兆兆字节高质量基因组序列,但使用如此庞大的数据进行基因组组装具有挑战性。

目前的技术涉及对所有可能的读取结果进行配对比较,为了比目前技术更有效地实现基因组组装,Bruijn和同事将目光投向了语言模型。从de Bruijn图(一种用于基因组组装的简单、高效的数据结构)概念出发,研究人员开发了一种最小空间化的de Bruin图(mdBG),它使用了核苷酸短序列而不是单个核苷酸。

Bruijn说:“我们的mdBG只存储了总核苷酸的一小部分,同时保留了整个基因组结构,这使它们比经典de Bruijn图的效率高出几个数量级。”

研究人员用该方法收集了黑腹果蝇的高保真数据(几乎具有完美的单分子读取精度),以及太平洋生物科学公司提供的人类基因组数据。他们在评估所得基因组时发现,与其他基因组汇编器相比,基于mdBG的软件所需时间仅为1/33、随机存取内存为1/8。新软件组装高保真人类基因组数据,比Peregrine汇编器快81倍,内存使用量为1/18,比hifiasm汇编器快338倍,内存使用量为1/19。

接下来,研究人员建立了一个包含661406个细菌基因组的索引,这是迄今为止同类索引中规模最大的。他们发现,这种新技术可以在13分钟内搜索到所有的耐药基因,而使用标准序列比对需要7个小时。

Berger说:“我们知道该技术是有效的,但不知道在进一步优化代码后,它能在真实数据上扩展得如此好。”

巴斯德研究所研究员、该研究参与者之一的Rayan Chikhi说:“新技术不需要一些通常昂贵的预处理步骤,比如大多数基因组组装方法需要的错误校正。”

“我们还可以处理高达4%错误率的测序数据。”Berger补充说,“随着错误率不同的长读测序仪价格迅速下降,这种能力为测序数据分析大众化打开了大门。”

Berger指出,虽然该方法目前在处理太平洋生物科学公司高保真读数时表现最好(错误率远低于1%),但它可能很快就能与牛津纳米孔的超长读取兼容,目前牛津纳米孔的错误率为5%~12%,但很快能到达4%。

Berger说:“我们希望帮助科学家们建立快速的基因组检测站点,超越可能会忽略基因组之间重要差异的PCR和标记阵列。”

【训练奶牛上厕所能减少氨排放】中国科学报:农场里,牛吃草时可以随意排泄,粪便的积累和扩散经常污染当地的土壤和水道。虽然,人们可以把牛关在牲口棚里,但在这些狭小空间里,它们的尿液和粪便会联合产生氨—— 一种间接的温室气体。

9月13日,在发表于细胞出版社(Cell Press)旗下期刊Current Biology(《当代生物学》)的一篇文章中,研究人员表示,如果奶牛可以学会“上厕所”,以便饲养者收集和处理粪便,就能减少空气污染,并创建更开放、对动物友好的农场。

“人们通常认为牛没有能力控制排便或排尿。”论文合著者、德国农场动物生物学研究所(FBN)动物心理学家Jan Langbein说。但他和团队质疑这种想法。“跟许多其他动物一样,牛非常聪明,它们能学会很多东西。那它们为何不能学会使用厕所呢?”

为了训练小牛如厕,Langbein研究小组与来自FBN、莱布尼兹老龄化研究所和新西兰奥克兰大学的科学家进行了研究,他们将这个过程称为MooLoo训练。一开始,当小牛在厕所小便时,他们奖励它们。然后当小牛需要排尿时,研究人员允许它们从外面接近厕所。

牛粪便中产生的氨不会直接导致气候变化,但当它到土壤中后,微生物会将其转化为一氧化二氮,这是仅次于甲烷和二氧化碳的第三重要温室气体。农业是氨排放的最大来源,其中畜牧业占了排放量的一半以上。

“你必须试着让动物参与到这个过程中,并训练它们遵循学到的东西。”Langbein说,“我们猜测可以训练这些动物,但能训练到什么程度,我们不知道。”

为了鼓励它们上厕所,研究人员希望让小牛把在厕所外小便和不愉快经历联系起来。“作为惩罚,我们首先使用入耳式耳机,每当它们在外面小便时,我们就播放非常难听的声音。”Langbein说,“我们认为这样做会惩罚动物,而且不会使它们太反感。最终能起到很好的威慑作用。”在几周里,研究小组成功地训练了16头小牛中的11头学会如厕。值得注意的是,犊牛表现出了与儿童相当的水平,并优于幼儿。

Langbein乐观地认为,通过更多训练,相关成功率可以进一步提高。“研究了牛10年、15年、20年,我们知道这些动物很有个性,它们能以不同的方式处理不同的事情。”既然,研究人员知道了如何训练奶牛如厕,他们想把该研究成果应用到真正的养殖场和户外系统中。Langbein希望“几年后所有的奶牛都能自己上厕所”。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 网友评论:“一只大菌子啊”:非常详细非常正常的恋爱过程,女方朋友圈公开恋情,带胖猫去见自己父母公开男友,胖猫的转账她不要胖猫硬要转了然后block她导致无法转回
  • 被萧逸听见,萧逸当天就买了一大堆男士护肤品,还酸溜溜的和你说:“我要好好保养,省得人老珠黄被萧小五嫌弃。而且剧情真的好弱智啊啊啊啊 别说大学生了,高中生日常也没
  • 有一种落差是,你总是羡慕别人的成功,自己不敢开始,立即行动起来,永远不玩。在成长的路上,每个人都有一份“专属孤独”一个人的孤军奋战,一个人的驰骋沙场,一个人的千
  • 今天一早,阳光加持,气温持续抬升,8时到11时,中南大部地区气温陆续突破30℃,夏日感十足。#河北大范围降水马上到# 】又是晴热持续的一天,不过,大风、雷雨、降
  • (我知道有人会说下周回旋镖,但是无论怎么帮言少哲洗,他就是放走了小桃,小桃后面杀了那么多人,如果知道是言少哲放走了她,会不会疯了?这种剧情是在什么情况下写的,喝
  • “医生说路上可能有一定风险,孩子可能随时有生命危险,但我还是想给孩子转院,8号晚上8点多,我们住进了南阳市妇幼保健院的ICU,孩子当时还有意识,会喊爸爸妈妈,但
  • )看完无字天书,缘主请求去拜桃花仙子,她说,自己感情非常坎坷,之前有人说她婚姻缘薄,后来有高人帮她在头顶种了枝桃花,才有了婚姻,但是婚姻非常短暂,目前一直单身,
  • 所以这就是一件他曾做过的、很标准的错事,符合策划的主题,他想写出来有啥问题吗还真没有。读书是一方面,但读书只是意识上知道了,但并不代表你真的知道。
  • 拜登政府决定对华新征关税后,美国零售业领袖协会告诉路透社,该行业正在评估受影响的特定产品清单,并补充说,“零售商对目前将于本月底到期的产品豁免越来越感到焦虑”。
  • 有时候不得不感叹一下金钱的魔力,在我的安排下,短短一天的时间,“如约”影楼的负面影响就达到了最高峰,全网都知道了他们的缺德行为,强烈地谴责。有时候不得不感叹一下
  • 更难得的是他们都适时保持了低调[赞][赞]*[围观]不干涉不打扰,需要时冲锋陷阵,不需要时安静守候,我以为这就是我们跟所爱的偶像最好的距离。人都向往优秀,愿意跟
  • 给的理由就是,一个人生活的自由自在,干嘛要找一人管钱。啥意思我听不懂你在说什么[笑cry][笑cry] 搞明白后她就把手指放在鱼嘴巴里那种玩两下 我:啊——原来
  • 我对生活中每个遇到的人都有保持真诚,但是不代表我没有堤防,所以付出我的真心给别人需要时间,在这段时间里一切都在美好的,不知道为什么在我付出真心,觉得遇到可以依靠
  • 寻狗启示#郑州# 特征:比熊 八岁 母,掉了几颗牙齿 鼻子有点褪色,有芯片(芯片名叫果果)名字:美妞走失时间:5月15号上午走失地点:郑州市金水路与西三环交
  • 针对用芽接法嫁接法已是活得植株,在解除绑定后15多天,就能在芽接位上边5公分左右剪砧,剪砧后底部将抽出来很多琬润,需及时清除,以防与芽接角逐营养物质,危害接芽萌
  • #韩漫分享[超话]##韩漫 韩国漫画##漫画推荐##最萌身高差##刘宇宁开始推理吧# #刘宇宁南珩离十六# #摩登兄弟[超话]#刘宇宁卓不凡刘宇宁天行健
  • ”我疑惑地指了指她那几根残破不堪的东西她倒是无所谓 挑了根最完整的戳我嘴里 又拿起夭折的那根叼在自己嘴里我很安静的帮她点了火 她接过打火机 说礼尚往来 也要帮我
  • \n值得入手★绝对的上档次?原版做法绝对感性?优雅风格不磨脚行走神器\n码数:35-41(34-42定做)\n面料:进口真丝\n内里:内里羊皮\n跟高:4cm~
  • 3、庚为他,庚处长生旺地为吉相,临伤门为小凶之门,代表你们相处并不是十分愉快和谐,庚下临己,己为私心,小心眼,也说明他人不大方;上乘太阴,说明他人聪明有城府4、
  • 妈妈的衣物是我春节回家时为妈妈准备的,其实爸爸很早已经准备了,但我觉得颜色和款式不太好,说服爸爸又重新准备的,我最了解妈妈,我挑选的她肯定喜欢,衣服我都一件件看