生信技能树

生物医药寒冬下那些被裁员的年轻人

Bloger
生物医药寒冬下那些被裁员的年轻人 by 生信技能树 世间万物都逃不过周期,如果大家是2019毕业出来工作那么算是赶上了一个好时代,各种创业公司如雨后春笋冒出来,资本大力支持,随便买哪个生物医药股票都可以翻倍。但是到2021就进入了下行周期,各个公司基本都是腰斩甚至脚踝斩,真的是世事无常啊!

ChatGPT 在学术探索中的妙用:精选提问模板与经典Prompt 解析

Bloger
ChatGPT 在学术探索中的妙用:精选提问模板与经典Prompt 解析 by 生信技能树 前面我们分享了:让chatGPT做你的24小时生信教练,就是简简单单的对着chatGPT提问即可,一些小技巧就是如何更好的提问,包括更精准更详细的描述问题。但是这些仅仅是chatGPT的皮毛,恰好收到了一个深度 chatGPT使用策略的投稿,借花献佛给大家;

名校博士使用R语言大战医疗蛀虫

Bloger
名校博士使用R语言大战医疗蛀虫 by 生信技能树 看到了新华社 在2023-12-04 发布的新闻:《三甲医院超收21万余元医疗费,官方通报!》,提到了医院过度收费而且违规使用医保基金的问题,如下所示:

给你一个病毒感染与否的时间序列采样的转录组你能挖掘出什么

Bloger
给你一个病毒感染与否的时间序列采样的转录组你能挖掘出什么 by 生信技能树 大家最常接触的转录组数据分析教学环节都是二分组,处理和对照,疾病和正常,这样的差异分析很容易理解。但是真实的科研往往是更复杂一点,前面我们分享了:时间序列转录组多次差异分析以及时序分析,是不同时间点处理的肿瘤细胞系表达量芯片数据。

坚持是为了优雅的放弃

Bloger
坚持是为了优雅的放弃 by 生信技能树 定期更新的「我想问问熊」又来啦,这个系列内容只有一个原则:彼此坦诚。

谁说肿瘤高表达基因就是生存风险因子(学徒作业)

Bloger
谁说肿瘤高表达基因就是生存风险因子(学徒作业) by 生信技能树 非常多的粉丝在我们生信技能树后台留言询问,为什么他/她关注的基因明明是癌基因,明明是在肿瘤病人高表达(TCGA数据库搜索后的结果),但是却发现它对生存的影响居然是保护因子!(同样的网页工具)所以我这里安排一个学徒作业,大家需要去下载TCGA数据库的BRCA这个癌症的芯片和RNA-seq的表达矩阵,分别进行差异分析,拿到统计学显著的上下调基因列表。同样的,根据表达量把病人分成高低表达两个组后进行生存分析,这里主要是COX方法,把基因区分成为风险因子和保护因子。然后把两次分析的基因列表取交集,会拿到9个基因集,加油!当然了,你还可以把这个任务继续细化,比如可以把基因区分成为编码和非编码的,然后BRCA本身可以区分成为4个亚型,分开分析。关于TCGA数据挖掘我喜欢把TCGA数据库的应用划分为8个领域:1、探索各类肿瘤不同临床特征(性别、年龄、种族、临床分期)的预后(生存曲线)2、探索各类肿瘤与对照的单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(箱线图)3、探索各类肿瘤与对照的全局(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(差异分析流程)4、探索各类肿瘤中两个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平相关性(散点图)5、探索各类肿瘤中多个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平总结(热图)6、探索各类肿瘤中单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)与所有其它分子相关性并且排序7、探索各类肿瘤中单个基因突变或者单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的预后(生存曲线)8、探索各类肿瘤不同临床特征(性别、年龄、种族、临床分期)分组后的单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)特性的分布关于TCGA数据库TCGA数据库是目前最综合最全面的癌症病人相关组学数据库,包括:DNA SequencingmiRNA SequencingProtein Expression arraymRNA SequencingTotal RNA SequencingArray-based ExpressionDNA MethylationCopy Number array知名的肿瘤研究机构都有着自己的TCGA数据库探索工具,比如:Broad Institute FireBrowse portal, The Broad InstitutecBioPortal for Cancer Genomics, Memorial Sloan-Kettering Cancer Center关于生存分析我已经在生信技能树公众号已经多次介绍过生存分析:集思广益-生存分析可以随心所欲根据表达量分组吗生存分析时间点问题寻找生存分析的最佳基因表达分组阈值apply家族函数和for循环还是有区别的(批量生存分析出图bug)TCGA数据库生存分析的网页工具哪家强关于差异分析B站视频,几乎一半,都是围绕差异分析来的。转录组的上游分析视频以及代码资料在:https://share.

大规模-高通量-多组学-居然只能把食管癌分成两个亚型

Bloger
大规模-高通量-多组学-居然只能把食管癌分成两个亚型 by 生信技能树 最近在朋友圈刷到了2021年8月份发表在Nature Communications杂志的文章,标题是:《Large-scale and high-resolution mass spectrometry-based proteomics profiling defines molecular subtypes of esophageal cancer for therapeutic targeting》,我就下载看了看,研究者们对124对食管癌患者的肿瘤和配对癌旁组织进行了蛋白质组学和磷酸蛋白质组学分析,揭示了EC中失调的蛋白质和磷酸化位点,并根据蛋白质组分析将EC分为S1和S2两个分子亚型。