据科技日报报道,23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
据悉,Genos模型已在HuggingFace、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
北交所主题基金业绩回升新基金密集成立
近期,北交所股票活跃度显著提升,单日成交金额连续多个交易日超20...
lifeme魅蓝Blus2S无线耳机官宣全新豆青
感谢IT之家网友华南吴彦祖的线索投递!,魅蓝科技官方微博表示,l...
90后清华副教授王笑楠:当你找到了能研究五十年的
演讲中的王笑楠图源:时代财经蓬松的披肩长发、星星状耳坠、合体的黑...
科技股“零日到期期权”将至美股周五将迎来期权抢购
智通财经APP注意到,随着华尔街最热门的两种趋势发生碰撞,全球最...
网易2023Q1营收250亿元,将加大AIGC投
5月25日,网易披露了2023年第一季度财报。财报显示,网易一季...
第五期绿宝石医生榜单发布选拔标准更加严苛、榜单含
在24日举办的第五期绿宝石医生榜单发布会上,第5期绿宝石医生榜单...