aibiology

Artificial intelligence in biology

0%

GalNac (N-acetylgalactosamine) N-乙酰半乳糖胺

  • 靶向传递技术
    肝脏中约有17000个基因表达,只有不到1%的基因能被公共数据库中的siRNA序列靶向,需要靶向降解技术,GalNAc就是代表性技术。

  • ASGPR
    唾液酸糖蛋白受体(ASGPR)主要在肝脏表面表达;GalNAc是ASGPR的高度特异性配体。

  • 传递过程
    siRNA和GalNAc结合,通过GalNAc与ASGPR结合,内吞进入细胞,在endosome(low pH)中GalNAc-ASGPR解离,同时释放siRNA进入细胞,形成RISC复合体,抑制基因表达。

  • 关键步骤
    成功实施GalNAc用于siRNA传递的关键在优化核苷酸2'位点的化学结构,用硫代磷酸酯键替代磷酸二酯键,GalNAc-寡聚缀合物变得足够稳点,可以静脉或者皮下给药后到达靶细胞。

'GalNAc'
'GalNAc'

Debacker AJ, Voutila J, Catley M, Blakey D, Habib N. Delivery of Oligonucleotides to the Liver with GalNAc: From Research to Registered Therapeutic Drug. Mol Ther. 2020 Aug 5;28(8):1759-1771. doi: 10.1016/j.ymthe.2020.06.015. Epub 2020 Jun 17. PMID: 32592692; PMCID: PMC7403466.

反义链转录本

反义链转录本(antisense transcript,antisense RNA)是转录本过程中,相对于正义链转录本而言出现的转录本。

  1. 反义转录本广泛存在于生物体中,它的表达协同或者独立调控临近基因。

  2. 在转录、翻译和RNA降解等途径中,反义转录本能够调控靶标基因的表达量。反义转录本可以干扰正义链转录本的剪切。

  3. 反义转录本可能在染色质修饰因子上具有序列特异性和支架活性。

  4. 对正-反义转录本可以形成自我调节回路,在其中正义和反义表达达到平衡。这种特殊的结构相比转录因子蛋白更具调节优势。这种组织既影响正义链基因的最终表达水平,也影响调控反应的动态。

  5. 由反义转录介导的基因调控在“关闭”状态下有效抑制基因表达,并在诱导时增加基因表达反应性和细胞间变异性。

  6. 反义转录物提供了一种有效的调节模式,在去除刺激后具有快速反应和快速恢复,使细胞能够在不同的状态之间快速变化。

  7. 反义转录本既能协同基因的順式表达也能协同反式表达,这个互补的调节作用是转录因子不具备的。

  8. 反义转录物整合不同类型的调控信号并在基因表达过程的多个步骤中发挥作用的能力使它们成为基因调控的枢纽。

  9. 反义转录本表现出较低的(但不可忽略的)进化保守性,这表明它们的快速生成是一种适应新环境的机制,因此,潜在地增加了物种的适应性。

参考

Pelechano, V., Steinmetz, L. Gene regulation by antisense transcription. Nat Rev Genet 14, 880–893 (2013). https://doi.org/10.1038/nrg3594

细胞器

细胞协调复杂的生物学反应,采取在内部空间形成不同的区域,确保反应的顺利进行。
细胞器(organelles),是细胞中带有膜和无膜的物理空间。

有膜细胞器
-双层膜
细胞核、线粒体、叶绿体、质体等。
-单层膜
内质网、高尔基体、液泡、过氧化物酶体、溶酶体等。

无膜细胞器:核糖体、中心体、微管、微丝,核仁(nucleolus)、处理小体(P granules)、核体(nuclear bodies)、应激颗粒(stress granules。

相分离(phase separation)

研究表明,這些不具有膜的胞器是遵循物理原則,由液体与液体相位分离(phase separation)所构成的。

细胞內相位分离(phase separation)调控的重要机制,由細胞核內外的[RNA:蛋白质]比例差异,RNA 可以作为一种prion RNA 粘合蛋白,防止它們在細胞內產生致病性的不正常固态聚合。

概率与统计

概率统计其实是两个不同的概念。

  • 概率 probability
    概率是已知模型和参数,计算模型产生的的结果。

  • 统计 statistics

统计是有一堆数据,利用数据去推测模型和参数。 最大似然估计,最大后验估计、贝叶斯估计都是用来推测模型和参数的方法,属于统计。

统计假设检验是参数未知,使用已知数据推断某种假设是否成立。假设检验的种类包括:t检验,Z检验,卡方检验,F检验等等。

概率函数和似然函数

概率和似然看起来是两个很相似的概念,但是在统计学中,概率函数和似然函数却是两个不同的概念。

对于函数\(P(x|θ)\),输入有两个,\(x\)表示一个具体的数据;\(θ\)表示模型的参数。

  • 概率函数

对于函数\(P(x|θ)\),如果\(θ\)已知,\(x\)未知,这个函数就叫概率函数(probability function),它描述的是对于不同的样本点,其出现的概率是多少。 (相当于机器学习和深度学习的测试test过程,此时参数是训练好的,\(θ\)是确定的)

  • 似然函数

对于函数\(P(x|θ)\),如果\(x\)已知,\(θ\)未知,这个函数就叫似然函数(likelihood function),它描述的是对于不同的模型参数,出现这个x样本点的概率。 (相当于机器学习/深度学习模型的训练train过程,此时参数未确定,\(x\)是确定的)

  1. 最大似然估计,最大后验估计以及贝叶斯估计的理解整理

单细胞测序

源于异质性样本表达量精准检测的需求。传统的RNA-Seq分析的特定组织样本不同细胞类型的混样,称为 bulk RNA-Seq,衡量的基因在不用细胞类型中的平均表达量水平。 Bulk vs Single-Cell

Single-Cell的由Azim Surani和Fuchou Tang开发,后面经过不用的机构的迭代,技术不断完善和发展。

Single-Cell history
Single-Cell history

Single-Cell分析的一般步骤:

analysis-step
analysis-step

Single-Cell protocols

protocols
protocols
  1. mRNA-Seq whole-transcriptome analysis of a single cell

免疫 immunity

  • 先天免疫innate immunity
  • 后天适应性免疫adaptive immunity

免疫系统组成

免疫系统由免疫器官、免疫细胞以及免疫分子组成。
- 免疫器官
- 脾脏、骨髓、胸腺、淋巴结、扁桃体等
- 免疫细胞
- 淋巴细胞(B-cell/T-cell),吞噬细胞等
- 免疫因子
- 淋巴因子、免疫球蛋白、溶菌酶等

|类别 | B细胞| T细胞| |: -- | :-- | :--- | |来源 | 淋巴细胞(由骨髓中的造血干细胞分化)| 淋巴细胞(由骨髓中的造血干细胞分化)| |免疫层级|B细胞主要参与体液免疫| T细胞则参与细胞免疫| |识别受体|可以识别特定靶标的受体分子|T细胞负责识别“非自身”靶标,如病原体,但需要抗原(病原体上的一些小片段)经处理并由一种被称为主要组织相容性复合体(MHC)的“自身”受体呈递之后才能实现|

T细胞主要有两类:细胞毒性T细胞(T-cytotoxic)和辅助型T细胞(Helper T cell)。还有少量的T细胞属于第三类,即γδ T细胞,识别不结合MHC分子的完整抗原。

类别 辅助型T细胞 细胞毒性T细胞
作用 协同免疫反应 攻击杀死细胞
绑定抗原到 αβ T-cell受体 αβ T-cell受
共受体 CD 4 CD 8
抗原呈递 MHC II MHC I

两层免疫反应的区别

先天性免疫系统 适应性免疫系统
非特异性反应 致病源与抗原特异性反应
病源曝露后立即有强烈反应 病源曝露后须过一段时间才有强烈反应
含细胞性和体液性组分 含细胞性和体液性组分
无免疫记忆 具免疫记忆
可在几乎所有生物体内发现 仅在有下颔的脊椎动物体内发现

病原体 pathogen

  • 病毒 virus
  • 细菌 bacteria
  • 真菌 fungi
  • 单细胞生物 unicellular eukaryotic
  • 多细胞虫子 multicellular worm

病原菌识别

  • 先天免疫
    模式识别受体pattern recognition receptors, 具有广谱性
  • 适应性免疫
    • 重组DNA并选用合适的过程来产生免疫反应
    • 抗体、T-cell、B-cell
    • 记忆性免疫反应
  1. 免疫系统

表观修饰 epigenetic modification

  • DNA甲基化
  • 组蛋白修饰
  • RNA修饰
  • 非编码RNA修饰

组蛋白修饰

DNA分子需要高度螺旋折叠为染色质,然后高度螺旋成为染色体,才能放入7μm左右的细胞。该过程需要核小体(nucleosome)的参与。
核小体由H2A、H2B、H3、H4四种组蛋白(Histone)亚基各两个拷贝形成的八聚体和缠绕在外约146bp的DNA组成。
histone

组蛋白在相关酶催化下发生甲基化、乙酰化、磷酸化、泛素化和ADP核糖基化等动态修饰的过程,它可通过招募效应蛋白来改变染色质的开放或凝聚的状态,进而调控基因的表达。
modify
真核生物基因的转录主要分为转录起始(initiation)、暂停-释放(pausing-release)、延伸(elongation)和终止(termination)四个步骤,转录进程的顺利进行与DNA修饰、组蛋白修饰和RNA修饰等表观遗传修饰高度相关。

组蛋白修饰是可逆的共价修饰。共价修饰需要写入(writer)、插除(eraser),读取(reader)等相关的酶来参与。
writer-eraser-reader

  • Writer
    是催化化学基团添加到组蛋白上对其进行修饰的酶,例如:乙酰转移酶(HATs)、甲基转移酶(HMTs)、激酶和泛素酶等。
  • Eraser
    是从组蛋白上去除这些修饰的酶,例如:去乙酰化酶(HDACs)、去甲基化酶(HDMs)、磷酸酶、和去泛素化酶等。
  • Reader
    是识别特定翻译后修饰的底物并与之特异性结合的蛋白质或蛋白质复合物。

组蛋白修饰描述规则:组蛋白结构+氨基酸名称+氨基酸位置+修饰类型

Promoter (TSS) mark: H3K4m3
Enhancer (TF binding) mark: H3K4me1
Both enhancer and promoter: H3K4me2, H3/H4ac(esp H3K27ac), H2AZ
Repressive mark: H3K27me3(cpG island near promoters)
Long term suppression by DNA methylation: H3K9me3(repeat region in genome)

  • H3K4me3
    H3K4me3表示组蛋白H3亚基上赖氨酸4的三甲基化。
Abbr. Meaning
H3 H3 family of histones
K standard abbreviation for lysine
4 position of amino acid residue(counting from N-terminus)
me methyl group
3 number of methyl groups added

H3K4me2/3在细胞内是通过维持暂停Pol II(paused Pol II)在近端启动子区的稳定而促进基因激活;而H3K4me2/3对转录起始没有明显的调控作用cell reports

  • H3K27me3
    H3K27me3表示组蛋白H3亚基上赖氨酸27的三甲基化。
Abbr. Meaning
H3 H3 family of histones
K standard abbreviation for lysine
27 position of amino acid residue (counting from N-terminus)
me methyl group
3 number of methyl groups added
  • H3K27ac
    H3K27ac表示组蛋白H3亚基上赖氨酸27的乙酰化,这种修饰研究的最充分。
Abbr. Meaning
H3 H3 family of histones
K standard abbreviation for lysine
27 position of amino acid residue (counting from N-terminus)
ac acetyl group

H3K27ac主要位于活跃转录基因的启动子和增强子区域,在这些区域它与H3K4me3共存,一起促进基因激活表达(Creyghton et al., 2010)
此外,H3K27ac还可在基因间区域形成超级增强子,进一步促进基因表达(Creyghton et al., 2010) 。
组蛋白乙酰化多发生在组蛋白H3和H4的N端赖氨酸残基上。组蛋白带正电荷,DNA带负电荷,所以组蛋白与DNA结合非常紧密。而组蛋白乙酰转移酶将乙酰辅酶A的>乙酰基转移到组蛋白的赖氨酸残基上,会中和组蛋白的正电荷, 减弱DNA与组蛋白的相互作用,从而使DNA更容易与转录因子结合,因此组蛋白乙酰化往往与转录
激活相关。

  • 研究方法
    • ChIP-seq
    • CUT&Tag

两种技术都是通过特异性抗体捕获所要研究的组蛋白修饰,后分离与组蛋白修饰相结合的DNA,并通过对DNA进行测序和分析来推断组蛋白修饰的位置及丰度

  1. Histone H3K27ac separates active from poised enhancers and predicts developmental state

Ribo-Seq

核糖体印迹测序,Ribo-Seq或Ribosome profiling,是一种可以实时检测细胞内转录本翻译的测序技术。 可以检测coding 和 non-coding的RNA的翻译实况。
- large intergenic ncRNAs (lincRNAs)
lincRNAs被核糖体覆盖,但是却不具有翻译成蛋白质的能力。因为lincRNAs和经典的noncoding RNAs and 5′-UTRs具有相同的ribosome覆盖, 表明ribosome occupancy 单独不足以判断转录本具有蛋白编码能力。 ribo

  1. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling
  2. Ribosome Profiling Provides Evidence that Large Noncoding RNAs Do Not Encode Proteins

R-loop

三链核苷酸结构(three-stranded nucleic acid structure),由DNA:RNA杂合链和非模板的DNA链组成。
R-loop在很多关键的生物学过程中发挥重要功能,包括染色质修饰、转录调控、DNA损伤修复以及基因组稳定性等。
研究发现m6A能稳定R-loop的形成,进而调控基因转录的有效终止

m6A promotes R-loop formation