immune-network免疫网络**微环境(TME)是**周围的环境,包括周围血管,免疫细胞,成纤维细胞,信号分子和细胞外基质(ECM)。**与周围微环境密切相关,不断相互作用。**可以通过释放细胞外信号,促进**血管生成和诱导外周免疫耐受来影响微环境,而微环境中的免疫细胞可以影响*细胞的生长和进化。免疫细胞泛指所有参与免疫反应的细胞,也特指能识别抗原,产生特异性免疫应答的淋巴细胞等。主要包括T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、粒细胞、肥大细胞、辅佐细胞,以及它们的前体细胞等,是免疫系统的功能单元。**微环境中免疫细胞之间相互作用形成免疫网络,网络设立可以清晰了解**微...
术语解释:Cox回归:又称比例风险回归模型(proportionalhazardsmodel,简称Cox模型),是由英国统计学家。该模型以生存结局和生存时间为应变量,可同时分析多种因素对于生存期长短的影响。Cox模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型,因此在医学界被***使用。Logistic回归:又称逻辑回归模型,属于广义线性模型。逻辑回归是一种用于解决二分类问题的分析方法,用于估计某种事物的可能性。相较于传统线性模型,逻辑回归模型以概率形式输出结果,可控性高且结果可解释性强。数据要求:样本临床信息或生物学特征(基因突变、基因表达等)样本的随访数据(总生...
STEM基因表达趋势分析数据要求表达谱芯片或测序数据(已经过预处理)下游分析得到***富集的时间表达模式之后的分析有:1.时间表达模式中基因的功能富集2.时间表达模式中基因表达与性状之间的相关性挖掘模块的关键信息:1.找到时间表达模式中的**基因2.利用关系预测该时间表达模式功能文献1:DynamicEBF1occupancydirectssequentialepigeneticandtranscriptionaleventsinB-cellprogramming(于2018年1月发表在GenesDev.,影响因子)EBF1动态占据在B细胞中对序列表观遗传和转录过程的影响该文献采用...
术语解读:PPI:蛋白质-蛋白质相互作用(protein-proteininteraction)PPImoduleI:指蛋白质相互作用模块,一个模块指向一个功能数据要求:基因列表应用示例1:(于2018年3月发表在Immunity.,影响因子)T细胞活化过程中产生蛋白质组进行多重定量分析,然后对差异表达蛋白权重聚类,并将聚类蛋白叠加到PPI网络上以识别功能模块。D.模块大小的分布,通过将每个WPC(权重聚类结果)中的蛋白叠加到蛋白-蛋白相互作用(PPI)网络上识别模块。每个模块的蛋白质数量显示出来。E.各个模块及其交互的关系图。圆圈(节点)表示90个模块,圆圈大小与模块大小成比例。...
术语解读: TME: Tumormicroenvironment TMEscore: TMEsignature score(使用PCA算法计算得到,高意味着对病毒和干扰素免疫***和应答敏感。) PCA:Principal component analysis CIBERSORT:Cell type identification by estimating relative subset of known RNA transcripts CYT:Cytolytic activity EMT:Epithelial-mesenchymal-transit...
棒棒糖图是直观显示蛋白质结构上的突变点**简单且有效的方式。许多致*基因具有比任何其他基因座更频繁突变的优先位点。这些位点被认为是突变热点,棒棒糖图可以用于显示突变热点以及其他突变位点。并可以对比不同**/亚型的突变位点。 基本原理 将蛋白质结构根据氨基酸顺序绘制为长条形,以不同色块标注不同结构域,在基因突变导致氨基酸改变的位置标注棒棒糖,并在棒棒糖圆球标注位点的突变频数以及突变位点。 数据要求 基因突变或者蛋白质突变数据 下游分析 1、突变位点靶向药物分析 2、驱动基因突变分析 承担各类项目超过400余项。云南组学数据处理数据科学共同合作...
bubbles(不同分组的基因表达或通路富集展示): Bubbles可以同时展示pvalue和表达量。例如展示motif的pvalue和motif对应的转录因子的表达量,方便快速看出转录因子富集且高表达所在的group,预示着该分组对细胞状态的改变(例如细胞分化、转移、应激)起关键调控作用;例如做基因功能富集分析时,展示富集的通路qvalue和基因数量或geneRatio。 基本原理: Bubbles的实质是分组数据下基因表达量或通路内基因数量的可视化,同时可以展示pvalue。 数据要求: 表达矩阵,分组 利用甲基化数据分析样本的拷贝数变异。四川算法还原与开发数据...
bubbles(不同分组的基因表达或通路富集展示): Bubbles可以同时展示pvalue和表达量。例如展示motif的pvalue和motif对应的转录因子的表达量,方便快速看出转录因子富集且高表达所在的group,预示着该分组对细胞状态的改变(例如细胞分化、转移、应激)起关键调控作用;例如做基因功能富集分析时,展示富集的通路qvalue和基因数量或geneRatio。 基本原理: Bubbles的实质是分组数据下基因表达量或通路内基因数量的可视化,同时可以展示pvalue。 数据要求: 表达矩阵,分组 circos图通过圆圈和连线展示多个亚组之间的关系,包括且...
GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介导DNA转录,从而影响mRNA的表达过程。通俗意义上来说,基因互作关系指基于序列预测的靶基因对。miRNA通过与靶mRNA的结合,或促使mRNA降解,或阻碍其翻译,从而***目的基因的表达。竞争性内源RNA网络是靶基因预测的研究深入,简称ceRNA网络。通过进行ceRNA网络的分析,我们能从一个更为宏观的角度来解释转录体如何构建基因表达调控网络,从而进一步挖掘基因在其中的调控机制。基本原理:miRNA主要通过与靶基因的非翻译区(UTR)结合而发挥其作用,对miRNA和mRNA...
术语解释:Cox回归:又称比例风险回归模型(proportionalhazardsmodel,简称Cox模型),是由英国统计学家。该模型以生存结局和生存时间为应变量,可同时分析多种因素对于生存期长短的影响。Cox模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型,因此在医学界被***使用。Logistic回归:又称逻辑回归模型,属于广义线性模型。逻辑回归是一种用于解决二分类问题的分析方法,用于估计某种事物的可能性。相较于传统线性模型,逻辑回归模型以概率形式输出结果,可控性高且结果可解释性强。数据要求:样本临床信息或生物学特征(基因突变、基因表达等)样本的随访数据(总生...
GSEA分析:GSEA全名为GeneSetEnrichmentAnalysis(基因集富集分析)。用以分析特定基因集(如关注的GO条目或KEGGPathway)在两个生物学状态(如**与对照,高龄与低龄)中是否存在差异。能够研究基因变化的生物学意义。普通GO/KEGG富集的思路是先筛选差异基因,然后确定这些差异基因的GO/KEGG注释,然后通过超几何分布计算出哪些通路富集到了,再通过p值或FDR等阈值进行筛选。挑选用于富集的基因有一定的主观性,没有关注到的基因的信息会被忽视,所以有一定的局限性。在这种情况下有了GSEA(GeneSetEnrichmentAnalysis),其思路是...
术语解释:Cox回归:又称比例风险回归模型(proportionalhazardsmodel,简称Cox模型),是由英国统计学家。该模型以生存结局和生存时间为应变量,可同时分析多种因素对于生存期长短的影响。Cox模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型,因此在医学界被***使用。Logistic回归:又称逻辑回归模型,属于广义线性模型。逻辑回归是一种用于解决二分类问题的分析方法,用于估计某种事物的可能性。相较于传统线性模型,逻辑回归模型以概率形式输出结果,可控性高且结果可解释性强。数据要求:样本临床信息或生物学特征(基因突变、基因表达等)样本的随访数据(总生...
术语解释:Cox回归:又称比例风险回归模型(proportionalhazardsmodel,简称Cox模型),是由英国统计学家。该模型以生存结局和生存时间为应变量,可同时分析多种因素对于生存期长短的影响。Cox模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型,因此在医学界被***使用。Logistic回归:又称逻辑回归模型,属于广义线性模型。逻辑回归是一种用于解决二分类问题的分析方法,用于估计某种事物的可能性。相较于传统线性模型,逻辑回归模型以概率形式输出结果,可控性高且结果可解释性强。数据要求:样本临床信息或生物学特征(基因突变、基因表达等)样本的随访数据(总生...
PCA主成分分析测序技术的发展使得现在能够从宏观角度分析基因表达,但是也在一定程度上增加了数据分析难度。许多基因之间可能存在相关性,如果分别对每个基因进行分析,分析往往是孤立的,盲目减少指标会损失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用*****的数据降维算法。一般可应用的研究方向有:一组基因在多个分组中的差异情况,多个基因在该样本中的差异情况。基本原理PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地...
t-SNE(t分布随机邻域嵌入)是一种用于探索高维数据的非线性降维算法。它将多维数据映射到适合于人类观察的两个或多个维度。t-SNE非线性降维算法通过基于具有多个特征的数据点的相似性识别观察到的簇来在数据中找到模式。另外t-SNE的输出可以作为其他分类算法的输入特征。因为t-SNE算法定义了数据的局部和全局结构之间的软边界。t-SNE几乎可用于所有高维数据集,广泛应用于图像处理,自然语言处理和语音处理。在生物信息中可广泛应用于基因表达数据、基因甲基化数据、基因突变数据等,能够直观地对不同数据集进行比较。基本原理从方法上来讲,t-SNE本质上是基于流行学习(manifoldlearn...
Adonis(置换多元方差分析,分析不同分组或环境因子对样品差异的解释度):ADONIS置换多元方差分析(Permutationalmultivariateanalysisofvariance,PERMANOVA),又称非参数多因素方差分析(nonparametricmultivariateanalysisofvariance)、或者ADONIS分析。使用PERMANOVA可分析不同分组因素对样品差异的解释度,并使用置换检验进行***性统计。基本原理:置换多元方差分析(PERMANOVA,Adonis)是一种基于F统计的方差分析,依据距离矩阵对总方差进行分解的非参数多元方差分析方法...
GSEA基本原理从方法上来讲,GSEA主要分为基因集进行排序、计算富集分数(EnrichmentScore,ES)、估计富集分数的***性水平并进行多重假设检验三个步骤。**步对输入的所有基因集L进行排序,通常来说初始输入的基因数据为表达矩阵,排序的过程相当于特定两组中(case-control、upper-lower等等)基因差异表达分析的过程。根据所有基因在两组样本的差异度量不同(共有六种差异度量,默认是signal2noise,GSEA官网有提供公式,也可以选择较为普遍的foldchange),对基因进行排序,并且Z-score标准化。第二步是GSEA的**步骤,通过分析预先...
PCA主成分分析测序技术的发展使得现在能够从宏观角度分析基因表达,但是也在一定程度上增加了数据分析难度。许多基因之间可能存在相关性,如果分别对每个基因进行分析,分析往往是孤立的,盲目减少指标会损失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用*****的数据降维算法。一般可应用的研究方向有:一组基因在多个分组中的差异情况,多个基因在该样本中的差异情况。基本原理PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地...
PPImodule蛋白质互作蛋白质-蛋白质相互作用(protein-proteininteraction,PPI)是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体(proteincomplex)的过程。PPImodule是指共表达蛋白模块或蛋白质相互作用模块。蛋白质相互作用形成人体复杂的蛋白质相互作用网络,对蛋白质相互作用网络进行聚类形成模块从而帮助我们理解细胞的功能。我们一般使用PPImodule把基因列表跟蛋白相互作用网络联系起来。例如RNA-seq获得的差异表达基因,看他们在蛋白相互作用网络中,哪些基因处于同一module。基本原理:蛋白质在细胞中的功能取决于它与其...
PCA主成分分析测序技术的发展使得现在能够从宏观角度分析基因表达,但是也在一定程度上增加了数据分析难度。许多基因之间可能存在相关性,如果分别对每个基因进行分析,分析往往是孤立的,盲目减少指标会损失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用*****的数据降维算法。一般可应用的研究方向有:一组基因在多个分组中的差异情况,多个基因在该样本中的差异情况。基本原理PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地...
PCA主成分分析测序技术的发展使得现在能够从宏观角度分析基因表达,但是也在一定程度上增加了数据分析难度。许多基因之间可能存在相关性,如果分别对每个基因进行分析,分析往往是孤立的,盲目减少指标会损失很多有用的信息。PCA(PrincipalComponentAnalysis),即主成分分析方法,是一种使用*****的数据降维算法。一般可应用的研究方向有:一组基因在多个分组中的差异情况,多个基因在该样本中的差异情况。基本原理PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地...
下游分析针对LASSO获得的基因模型(或称基因Panel)的验证:1.计算风险指数RiskScore2.绘制ROC曲线、DCA曲线、列线图进行验证3.绘制生KM存曲线对基因模型中的基因进行解释和分析:1.基因注释2.靶向药物分析应用示例:文献1:PrognosticandpredictivevalueofamicroRNAsignatureinstageIIcoloncancer:amicroRNAexpressionanalysis.于2013年12月发表在LancetOncol.,影响因子。一个miRNA特征集在stageII结肠*的预后预测作用分析文章对stageII结肠*组...
不同分组的全基因组拷贝数变化的比较:**初目的:不同分组的拷贝数变异在染色体水平和染色体臂水平的展示和比较。应用:不同分组的全基因组拷贝数变化的比较,展示genome-wideDNAcopy-numberprofiles。不同染色体臂的变异与临床表型息息相关。输入数据格式:一个表征每个样本的染色体变异(gain,balance,loss)的数值矩阵和样本分组信息。或者拷贝数的原始结果,可处理成所需矩阵。参考文献:(2)::本文计算出病人的拷贝数变异情况后,按照之前病人的分组比较了不同分组的染色体变异的异同,找到特定的染色体变异模式。确定了各组的特征,如lmonosomy2inPFB...
ssGSEA(single sample GSEA)主要针对单样本无法做GSEA而提出的一种实现方法,原理上与GSEA是类似的。ssGSEA根据表达谱文件计算每个基因的rank值,再进行后续的统计分析。通过这个方法,我们可以得到每个样本的免疫细胞或者免疫功能,免疫通路的活性,然后根据免疫活性进行分组。 ssGSEA量化免疫细胞浸润**的一个优点就是自己可以定制量化免疫浸润细胞种类。目前公认并且用的**多的免疫细胞marker就是2013年发表在Immunity上的SpatiotemporalDynamicsof IntratumoralImmuneCellsReveal the Im...
GSEA数据要求1、通常为表达谱芯片或测序数据(已经过预处理),也可以是其他形式可排序的基因数据。2、具有已知生物学意义(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA结果之后的分析有:1.基因注释:1、绘制基因集富集趋势图(Enrichmentplot)横坐标:按差异表达差异排序的基因序列。数值越小(偏向左端)的基因**在shICAM-1组中有越高倍数的差异表达,数值越小(偏向右端)的基因在对照组中有越高倍数的差异表达。纵坐标:上方的纵坐标为富集打分ES,ES是一个动态的值,沿着基因序列,找到条目中的基因则增加评分,否则减少评分。通常用偏离0**远的值作...
GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介导DNA转录,从而影响mRNA的表达过程。通俗意义上来说,基因互作关系指基于序列预测的靶基因对。miRNA通过与靶mRNA的结合,或促使mRNA降解,或阻碍其翻译,从而***目的基因的表达。竞争性内源RNA网络是靶基因预测的研究深入,简称ceRNA网络。通过进行ceRNA网络的分析,我们能从一个更为宏观的角度来解释转录体如何构建基因表达调控网络,从而进一步挖掘基因在其中的调控机制。基本原理:miRNA主要通过与靶基因的非翻译区(UTR)结合而发挥其作用,对miRNA和mRNA...
棒棒糖图是直观显示蛋白质结构上的突变点**简单且有效的方式。许多致*基因具有比任何其他基因座更频繁突变的优先位点。这些位点被认为是突变热点,棒棒糖图可以用于显示突变热点以及其他突变位点。并可以对比不同**/亚型的突变位点。 基本原理 将蛋白质结构根据氨基酸顺序绘制为长条形,以不同色块标注不同结构域,在基因突变导致氨基酸改变的位置标注棒棒糖,并在棒棒糖圆球标注位点的突变频数以及突变位点。 数据要求 基因突变或者蛋白质突变数据 下游分析 1、突变位点靶向药物分析 2、驱动基因突变分析 糖尿病药物基因组学分析找到新的作用靶点。云南数据库建设数据科...
cox风险比例回归模型:产品详情产品评论(0)比例风险回归模型,又称Cox回归模型,是由英国统计学家。模型可以用来描述了不随时间变化的多个特征对于在某一时刻死亡率的影响。它是生存分析中的一个重要的模型。应用场景cox比例风险回归模型,由英国统计学家主要用于**和其他慢性疾病的预后分析,也可用于队列研究的病因探索单因素cox分析主要探索单个基因的**预后影响cox分析可用于转录组,甲基化,miRNA,LncRNA,可变剪切等等基本原理:在这里,是一个与时间有关的基准危险率,其选择具有充分的灵活度,一种可能的选择是采用概率论中的Weibull分布。是模型的参数。由于只要给定数据,就能够...
STEM基因表达趋势分析基因调控网络是一个连续且复杂的动态系统。当生物体按照一定顺序发生变化或者受到外界环境刺激(如受到不同浓度的化学药物诱导)时,基因表达变化也会呈现趋势特征。趋势分析就是发现基因表达的趋势特征,将相同变化特征的基因集中在一种变化趋势中,从而找到实验变化过程中相当有有代表性的基因群。STEM(ShortTime-seriesExpressionMiner),中文名短时间序列表达挖掘器。该软件主要用于分析短时间实验数据,也可用于多组小样本数据。推荐3至8组数据。一般可应用的研究方向有:多个时间点的时间序列数据,例如多个发育时期、处理后多个时间点取样。基本原理STEM...
GeneBodyProfile(对比不同的样品在某一区域的信号特征,不**于ChIP-seq、DNase-seq、ATAC-seq数据):GeneBodyProfile表观遗传修饰和对基因表达、细胞发育等过程有着深远的影响,但相关的研究还未完善。通过对比不同的样品在某一区域的信号特征,了解不同情况下该基因的表观遗传情况,帮助更好的了解其发***展过程。一般应用场景:观察相关基因转录起始位点(TSS)、转录终止位点(TTS)、genebody以及两侧信号特征;观察某一功能区域(CpGi、TSS、TTS、peaksummits或enhancer区)及其两侧信号特征。数据要求:ChIP-...