新产品 | 支持5K+群体基因组的快速和多云弹性计算的大规模群体基因组计算多云基础设施工具PopGenomics
公司动态
2023-03-30
百奥云新产品PopGenomics上线
无法低成本高效的分析群体基因组?测序公司在云端释放数据无法有效利用?各种生信脚本满天飞无法管理和重用代码?之前的分析结果无法复现?测序公司只管最简单的分析,无法衔接育种计算和分析?
系统示意图
近日,百奥云发布大规模群体基因组计算多云基础设施工具PopGenomics。PopGenomics帮助农业育种客户实现Pay-as-You-Go的数千规模(5K+)的基因组的按需优化计算。客户无需创建IT团队,无需预先花费巨额成本购置本地和云端的计算集群,仅需为真正的计算付费。
PopGenomics采用基因组工作流标准,提高客户的代码可重用性和为客户降低代码维护成本。
PopGenomics采用的GPU加速方案能够极大程度缩短最耗时的计算步骤,为客户节省宝贵时间。
PopGenomics基于基础设施即代码的理念设计,内置计算资源优化策略,能够依据客户数据进行计算资源的即时创建,按需使用和及时释放,实现真正的按需计算,避免资源浪费造成的额外成本,从而帮助客户低成本高效率地完成计算作业。
PopGenomics支持赛乐BaseNumber平台以及多个公有云平台,用户可以通过PopGenomics命令行提交作业,也可以通过PopGenomics API进行业务系统整合。
除此之外,PopGenomics也支持全托管业务,即客户提供云端数据,由PopGenomics团队完成计算业务,客户只需下载计算结果。
标准工作流语言WDL:
https://github.com/gatk-workflows/gatk4-germline-snps-indels
验证标准工作流文件
PopGenomics on 火山引擎
PopGenomics on 阿里云
系统整合和机器人通知
没有最快,只有更快
没有最准,只有更准
百奥云PopGenomics采用MGISEQ2000测序仪和人类金标准GIAB样本数据,对基于GPU加速的基因组变异检测进行基准测试。基准测试结果表明,与主流标准的GATK相比较,基于GPU的方案在SNP结果上更优,在INDEL结果上一致,完全证明基于GPU加速的方案的准确性。
农业动植物基因组测试
多个动植物基因组在内的基准测试中,最高基因变异检测提速达到300倍以上。
GPU加速
GPU芯片是专?为人工智能,机器学习以及计算加速设计的芯片。百奥云PopGenoimcs产品将基因组计算加速和基因组人工智能和机器学习分析平台统一在GPU公有云以及私有云上,从而实现基因组分析的极速交付。
战略合作伙伴
百奥云与赛乐基因在农业领域达成战略合作伙伴关系,携手为农业基因组研究和育种客户提供快速,精准,高效的服务!
收费模式
PopGenomics有两种收费模式。第一种是年费制,对于具有公有云账户的育种企业和机构,只需购买PopGenomics标准年费,即可获得PopGenomics工具,用户在自己的计算环境下配置公有云账户和数据地址,以及标准基因组工作流配置文件WDL,即刻开始群体基因组计算分析,分析结束后公有云计算资源自动释放销毁,计算结果存储在配置文件中指定的公有云地址。第二种是半托管(公有云账户管理和流水线定制开发)和全托管方式(端对端数据到计算结果),需要育种企业和机构和百奥云进行商谈。
欢迎垂询
bdai@biobin.com.cn
END
相关推荐
百奥繁育 | 良种选育的信息管理系统
8月25日,江西省水稻种质资源创新交流及智能育种技术研讨会在江西省农科院顺利召开。江西农业大学、江西师范大学、广东省农科院、江西省农科院、中国水稻所江西早稻中心、南昌市农科院、赣州市农科所有关专家代表以及省内种企代表共约40人参与了本次交流会议。
有人说,植物育种的过程就像工厂流水线。挑选的种质即原材料,根据市场需求进行设计与加工,送入田间生产线后,一代代优中选优,还得经过严格的产量、品质、抗性测试,过五关斩六将,最终拿到审定编号,成为可以推广的成熟产品。 虽然流程相似,但育种工作远不及工厂生产那样标准。田间环境气候复杂、真实性状判断困难、水肥条件难以统一……种种困难下,选育良种成了概率事件,育种家们都有种“尽人事听天命”的无奈感。
育种4.0时代,比拼的是科技创新,关键是通过数字化、信息化、智能化让育种过程缩短周期、提升效率、降低风险,而这也是长沙百奥云数据科技有限公司(百奥云)的创业初衷。
1. 利用PopGenomics快速对基因组实现高质量组装 基因组组装是将全基因组测序的小片段(reads长度100 bp-100 kb)通过算法拼接成尽量长的片段(contig 和scaffold,长度几十kb 到Mb 不等)或者整条染色体的过程。获得包含基因组全序列的参考基因组是对动植物进行基因组学研究和育种利用的前提[1]。 由于植物基因组具有非常丰富的多样性,参考已发表的少数物种组装新的物种,有时却无法达到理想的组装效果。测序技术发展提供了短序列测序、单分子测序、光学图谱、Hi-C 图谱等多种测序技术及其组合的组装方案,到目前为止,已经有上千个植物基因组被组装(图1)。然而,如何以最低成本快速获得满足需求的高质量基因组,仍然是科研人员和育种数据分析人员普遍面临的一个问题。
7月26日,顶着炎炎夏日 在公司CSO桂進老师的带领下 举行了一场别开生面的劳动体验。