GSEA数据要求1、通常为表达谱芯片或测序数据(已经过预处理),也可以是其他形式可排序的基因数据。2、具有已知生物学意义(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA结果之后的分析有:1.基因注释:1、绘制基因集富集趋势图(Enrichmentplot)横坐标:按差异表达差异排序的基因序列。数值越小(偏向左端)的基因**在shICAM-1组中有越高倍数的差异表达,数值越小(偏向右端)的基因在对照组中有越高倍数的差异表达。纵坐标:上方的纵坐标为富集打分ES,ES是一个动态的值,沿着基因序列,找到条目中的基因则增加评分,否则减少评分。通常用偏离0**远的值作为**终富集打分。下方的纵坐标**基因表达与表型的关联,***值越大**关联越强,数值大于0**正相关,小于0则**负相关。 云生物提供数据科学服务。上海生物/药物信息学分析数据科学售后服务
sankey
?;迹╯ankey)是一种数据流图,每条边**一条数据流,宽度**数据流的大小。一套数据集可能有多重属性,每层属性之间有交叉,就可以用这种图来展示。一般应用场景:分组与基因为多对多关系,展示高频突变基因所处的分组;miRNA和靶基因的关系;人群按性别、年龄、家族史等特征分组,展示不同分组得**的规律。
数据要求:
多个分组及其关系,包括且不限于基因表达、突变。
下游分析:
1. 补充展示部分的已有相关研究
2. 解释展示部分对研究课题的意义 四川算法还原与开发数据科学欢迎咨询基因组数据全链条处理。
蛋白质主要由碳、氢、氧、氮等化学元素组成,是一类重要的生物大分子。蛋白质的功能由蛋白质的三维结构决定。蛋白质三维结构绘图,可以直观地展示蛋白质三维功能结构,广泛应用于单核苷酸突变功能分析、药物蛋白分子相互作用分析等研究领域。基本原理蛋白质三维结构绘图主要分为蛋白质三维结构预测以及对结构进行可视化两步。蛋白质三维结构预测是基于蛋白质中氨基酸序列预测蛋白质折叠结构的步骤,**常用的预测方法为同源建模,同源建模的原理是序列相似的蛋白质具有相似的蛋白质结构,要推测一个未知结构蛋白的三维结构,只需要找到与之序列高度相似的已知结构模板。在无法进行同源建模(找不到模型)的情况下,还有折叠识别及从头建模法,但是计算量大运行缓慢且建模准确度不如同源建模。获得蛋白质三维结构预测的pbd文件后还需要通过分子三维结构软件绘制可视化的三维图,并分析特殊位点(分子对接或突变位点分析),常用的有pymol和DeepView等。数据要求目标蛋白的氨基酸序列或者编码蛋白的基因序列,突变数据等。下游分析突变位点靶向药物分析等。
术语解释:Cox回归:又称比例风险回归模型(proportionalhazardsmodel,简称Cox模型),是由英国统计学家。该模型以生存结局和生存时间为应变量,可同时分析多种因素对于生存期长短的影响。Cox模型能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型,因此在医学界被***使用。Logistic回归:又称逻辑回归模型,属于广义线性模型。逻辑回归是一种用于解决二分类问题的分析方法,用于估计某种事物的可能性。相较于传统线性模型,逻辑回归模型以概率形式输出结果,可控性高且结果可解释性强。数据要求:样本临床信息或生物学特征(基因突变、基因表达等)样本的随访数据(总生存期,生存状态)或样本的分组情况下游分析:1.补充相关因素的已有相关研究2.解释相关因素对研究课题的意义。 微生物多样性分析桌面软件。
棒棒糖图是直观显示蛋白质结构上的突变点**简单且有效的方式。许多致*基因具有比任何其他基因座更频繁突变的优先位点。这些位点被认为是突变热点,棒棒糖图可以用于显示突变热点以及其他突变位点。并可以对比不同**/亚型的突变位点。
基本原理
将蛋白质结构根据氨基酸顺序绘制为长条形,以不同色块标注不同结构域,在基因突变导致氨基酸改变的位置标注棒棒糖,并在棒棒糖圆球标注位点的突变频数以及突变位点。
数据要求
基因突变或者蛋白质突变数据
下游分析
1、突变位点靶向药物分析
2、驱动基因突变分析 公共数据库挖掘、诊疗软件开发、算法还原与开发、临床统计等。上海生物/药物信息学分析数据科学售后服务
实验室致病类病原微生物数据分析平台。上海生物/药物信息学分析数据科学售后服务
survivalCurve生存分析生存分析(survivalCurve)旨在更好地分析对不同因素对患者预后的影响,从而找到影响患者疾病的关键因素。生存曲线(Kaplan-Meier曲线)是生存分析的基本步骤,展示分类样本的生存曲线,从而揭示不同因素对疾病预后的影响。一般可应用的研究方向有:患者的生存期跟基因变异的关系、药物处理导致模式动物生存期变化?;驹鞬aplan-Meier法,直接用概率乘法定理估计生存率,故称乘积极限法(product-limitmethod),是一种非参数法。相比其他方法,KM曲线能更好的处理删失数据。先将样本生存时间从小到大排列。若遇到非删失值和删失值相同时,非截删失****。在生存时间后列出与时间相应的死亡人数,期初病例数(即生存期为某时间时尚存活的病例数)。然后计算活过每个时间点的生存率。以生存时间为横坐标,生存率为纵坐标所作的曲线,即为Kaplan-Meier曲线。术语解释风险比(HazardRatio,HR):Kaplan-Meier方法中计算的风险比HR为两分组对生存期影响的比例,用来描述该基因高表达对生存期的危险程度。该方法中的假设检验为两组中样本的生存期是否存在差异,即该因素是否会导致生存期的改变。删失(censored):在生存分析中。 上海生物/药物信息学分析数据科学售后服务