家犬作为人类生活和工作中的伙伴,其进化研究一直是遗传学研究的一个热点。然而现在使用的家犬参考SNP(single nucleotide polymorphism)数据集存在数量少、采样地不够广泛和测序覆盖度差异大等问题,而且SNP数据主要来源于两个品种的两个犬只,并不利于家犬的群体遗传研究。
目前,二代测序产生了大量高质量的家犬和其祖先物种灰狼的全基因数据。为了弥补参考SNP数据集的不足及满足大数据复用的需求,在中国科学院院士、云南大学特聘教授张亚平和中国科学院昆明动物研究所王国栋博士的指导下,云南大学生命科学学院博士研究生白冰联合中国科学院北京基因组研究所高级工程师赵文明、博士研究生唐碧霞,建立了第一个犬类SNP数据库——DoGSD。该成果近日发表在生物信息学领域国际知名期刊Nucleic Acids Research(《核酸研究》,2013年影响因子8.808),云南大学为第一完成单位和通讯作者单位,白冰、赵文明和唐碧霞为并列第一作者,张亚平院士与王国栋博士为共同通讯作者。
DoGSD包含了参考SNP数据集,69个家犬及8个灰狼的全基因组SNP数据,所包含的SNP数量是原参考数据集的7倍。DoGSD弥补了原数据集采样地少、覆盖度差异大等问题,且首次在SNP数据集中加入了中国土狗的数据。DoGSD为用户提供了友好的检索,查询及下载页面,其中的同义/非同义SNP检索页面,比较查询功能将为用户检索基因相关SNP及观察个体间SNP的差异提供很大的方便。此外,DoGSD还第一次在数据库中提供了重要的群体遗传学参数的计算结果:Fst和等位基因频率,方便用户筛选和进一步分析有选择信号的SNP。
Nucleic Acids Research 1974年创刊,由英国牛津大学出版社出版,在生命科学研究领域享有较高声誉。
撰稿:祁志浩
(编辑:李哲)