日本鳀染色体水平基因组组装与注释:解锁海洋生态关键物种的遗传密码

【字体:

时间:2025年01月23日

来源:Scientific Data 5.8

编辑推荐:

日本鳀(Engraulis japonicus)在海洋生态系统中意义重大,但基因组资源匮乏限制了相关研究。研究人员利用多种测序技术构建其高质量染色体水平基因组序列并注释分析。结果获得 1.4 Gb 基因组,完整性达 94.07% 。为后续研究奠基,助力渔业管理与保护。

在广袤无垠的海洋世界里,日本鳀(Engraulis japonicus)虽身形娇小,却扮演着举足轻重的角色。它是黄海和东海单一物种生物量最大的硬骨鱼类,像一座桥梁,将浮游动物的能量传递给更高营养级的鱼类,稳稳占据着生态系统的关键位置。然而,随着全球气候变化的加剧,海洋生态环境变得愈发恶劣,加上过度捕捞的压力,日本鳀的种群数量急剧下降,已被列为过度开发物种,其生存现状令人担忧。

更棘手的是,科学界对日本鳀的遗传信息了解极为有限。以往的研究多依赖线粒体细胞色素 b(Cyt b)、线粒体 DNA 控制区片段和微卫星等少量遗传标记,这些方法难以全面反映其种群结构和遗传变异情况。不同研究因采用的遗传标记和分析方法各异,得出的结论也大相径庭,这让渔业管理者在制定保护策略时举棋不定,严重阻碍了日本鳀资源的有效管理和保护。此外,鳀科鱼类整体的基因组数据都十分稀缺,已知基因组序列的仅有 6 种,这使得我们对鳀科乃至鲱形目鱼类的进化历程和环境适应机制的探索困难重重。

为了打破这些困境,中国水产科学研究院黄海水产研究所等机构的研究人员勇挑重担,开展了一项极具开创性的研究。他们成功构建出日本鳀高质量的染色体水平基因组序列,并进行了深入的注释和分析。这一研究成果发表在《Scientific Data》上,为日本鳀的保护和研究开辟了新的道路。

研究人员在这项研究中运用了多种先进的技术方法。他们从黄海青岛附近海域采集了一条成熟雌性日本鳀样本,分别利用太平洋生物科学公司(Pacific Biosciences)的 HiFi 长读长测序技术、Illumina 短读长测序技术和 Hi-C(染色体构象捕获)技术对样本进行测序。通过这些技术,获得了大量高质量的测序数据,为后续的基因组组装和分析奠定了坚实基础。

在染色体水平基因组组装方面,研究人员首先利用 Illumina 测序数据进行 K-mer 分析,初步预测基因组大小约为 1,045.1 Mb,重复序列和杂合度分别约为 54.0% 和 2.3% 。接着,他们使用 PacBio HiFi 测序数据进行拼接,得到总长度约为 1,467.6 Mb 的 contigs,其 N50 长度达 456.3 kb。随后,借助 Hi-C 测序数据,将 contigs 成功锚定到 24 条假染色体上,构建出总长度为 1,423.3 Mb 的染色体水平基因组,其 scaffold N50 达到 55.0 Mb 。这一成果不仅揭示了日本鳀基因组的基本框架,还展示了其复杂的基因组结构。

对基因组重复序列的注释发现,日本鳀基因组中重复序列占比高达 54.9%,其中长散在核元件(LINEs)、短散在核元件(SINEs)和长末端重复序列(LTRs)分别占基因组的 6.3%、0.9% 和 9.1% 。这些重复序列在基因组的进化和功能调控中可能发挥着重要作用,为深入理解日本鳀的遗传特征提供了关键线索。

在基因预测和功能注释环节,研究人员综合运用基于同源性、证据和从头预测等多种方法,共预测出 24,405 个非冗余蛋白质编码基因。与其他几种鱼类相比,日本鳀基因的长度、外显子长度和编码序列(CDS)长度分布模式相似。同时,通过与公共数据库比对,23,709 个基因得到功能注释,占预测基因总数的 97.1% 。此外,还预测出 23,984 个非编码 RNA(ncRNAs),包括 tRNA、rRNA、miRNA 和 snRNA 等,进一步丰富了日本鳀的基因信息。

对基因组组装质量的评估结果令人欣喜。通过与 Actinopterygii 数据库的比对,日本鳀基因组的完整性高达 94.07%,其中完整且单拷贝的基因占 88.71%,完整且重复的基因占 5.36%,碎片化和缺失的基因比例较低。PacBio HiFi 长读长和 Illumina 短读长的比对率分别达到 99.91% 和 97.97%,共识质量值(QV)为 49.74,这些数据充分表明该基因组组装质量高,可信度强。

综上所述,这项研究成功构建了日本鳀染色体水平的高质量基因组序列,全面揭示了其基因组特征。这一成果为深入研究日本鳀的遗传多样性、适应性进化、种群动态以及遗传保护等提供了宝贵的数据资源和坚实的理论基础。同时,也为鳀科乃至鲱形目鱼类的比较基因组学研究搭建了重要平台,有助于我们更好地理解鱼类的进化历程和环境适应机制,为海洋生物多样性保护和渔业资源可持续利用提供有力支持,在海洋生物学和渔业科学领域具有深远的意义和广阔的应用前景。

相关新闻