词汇表

5-mC

5-甲基胞嘧啶(5-methylcytosine),表观遗传DNA修饰的常见形式,由胞嘧啶的第五位碳原子上加上一个甲基产生。

AI

AI (Artificial Intelligence) is technology that mimics human thinking by making assumptions, learning, reasoning, problem solving, or predicting with a high degree of autonomy.

ASCII

美国信息交换标准代码,ASCII码是计算机中字符的数字表示形式。

API

应用程序接口(Application Programming Interface),是应用程序提供给开发者、使用编程的方式来与程序进行交互的途径。

CADD

计算机辅助药物设计(Computer-Aided Drug Design, CADD)通过计算机模拟、计算和预测药物与受体生物大分子之间的关系,设计和优化先导化合物。首先通过X射线衍射等技术获得受体大分子结合部位的结构,利用计算机软件分析结合部位的疏水场、静电场、氢键作用等信息,再运用数据库搜寻或全新药物分子设计技术,得到与受体作用位点相匹配的药物分子,最后合成并测试这些药物分子的生物活性。

cDNA

互补DNA序列,mRNA逆转录后形成的双链DNA,与mRNA互补。

CDS

编码序列(Coding Sequence),能翻译成蛋白质的DNA区域。

Contig

重叠群,由一群测序读段拼接组装而成的连续DNA序列。

CNV

拷贝数变异(Copy number variation)

FDR

假阳性率(False Discovery Rate),衡量多次检验校正后的统计学显著性。

GO

基因本体(Gene Ontology),使用标准化词汇描述基因产物,分生物过程、细胞组份和分子功能三类。

GWAS

全基因组关联分析(Genome-Wide Association Study),通过对照分析或相关性分析,在全基因组范围内找出存在的序列变异,从中筛选出与复杂表型性状关联的基因变异。

HMM

隐马尔科夫模型(Hidden Markov Model),是一种常见的机器学习和数据挖掘方法,用于信号处理与模式识别。

InDel

插入/缺失(Insertion/Deletion)突变。

IoT

物联网(Internet of Things), 是指能连接家电、传感器等的互联网。

k-mer

在基因组组装或序列比对中,k-mer是指读段序列中长度为k的所有可能的子序列。

LD

Linkage Disequilibrium (连锁不平衡) is the non-random association of alleles at different loci in a given population.

lncRNA

长链非编码RNA(long noncoding RNA), 相对于小RNA,它一般长度超过200 bp。

MAF

种群中最小等位基因变异频率(minor allele frequency)。

mTOR

哺乳动物雷帕霉素靶点(mammalian target of rapamycin, mTOR

N50

基因组组装的加权平均重叠群大小。所有重叠群根据其长度排序并相加,当总长度等于或大于组装大小的50%时,那个重叠群的长度即为N50

Omics

组学(omics)数据指任意大规模、高通量技术手段所获得的数据。例如,基因组、转录组、蛋白质组,表观遗传组、代谢组,及成像组(imaginome)、连接组(connectome)与表型组(phenome)等。

ORF

开放阅读框(Open Reading Frame),以起始密码子(ATG)开始,并以终止密码子(TAA, TAG或TGA)结尾的密码子DNA连续片段。

OTU

可操作分类单元 (Operational Taxonomic Unit),常见的微生物多样性单位,可以代表一个物种或一群物种。

Q-SCORE

Phred质量值 (Phred quality score),用于表示测序结果中碱基错误发生概率的整数数值。如Q20表示测序碱基的出错概率为1/200。Q值通常用ASCII字符表示。

Reads

读段或短序列,DNA片段进行测序所得的序列。Read: A short DNA fragment which is read out by sequencer.

scaffold

骨架,从头组装所得的重叠群(contig)的有序排列,但重叠群之间仍然存在空位。

SNP

单核苷酸多态性 (single nucleotide polymorphism),由单核苷酸位点变异引起的DNA序列多态性。与单核苷酸变异(SNV)不同,SNP仅指在种群中频率达到一定阈值的(通常为1%)的常见SNV。

sRNA

小的非编码RNA (small RNA),主要类别有miRNA, siRNA和piRNA等。

SRA

短读段档案库,由美国国家生物技术信息中心(NCBI)维护的新一下测序数据档案库。类似的还有由欧洲生物信息学研究所(EBI)维护的欧洲核苷酸档案库(ENA)。

STS

A sequence-tagged site (STS) is a short DNA segment (200~500 bp) that has a single occurrence in a genome and whose exact location and base sequence are known.

TSS

转录起始位点 (transcription start site),启动RNA转录的DNA中的核苷酸位点。

UTR

mRNA分子上的非翻译区,位于mRNA分子的5'或3'端。

自由度

自由度(df)指的是计算某一统计量时,取值不受限制的变量个数,通常df=n-k,其中n为样本数量,k为被限制的条件数或变量个数。

results matching ""

    No results matching ""