生信初学者教程(癌症转录组学)

作者

生信学习者

发布于

2024年7月30日

欢迎

在生物信息学(生信)领域,随着高通量测序技术的不断发展,大量数据涌现,为科研工作者提供了丰富的资源。然而,对于初学者而言,如何从海量的数据中挖掘有价值的信息,并开展一个完整的生信项目,仍然是一个挑战。目前,市面上针对初学者的系统性、以项目为框架的生信教程相对较少,这无疑增加了初学者的学习难度。

鉴于此,结合先前的项目经验,笔者特别为初学者设计了一套基于癌症转录组数据的纯生信文章项目教程。该教程涵盖了项目设计、数据下载、数据处理、数据分析以及结果整理和文章撰写等关键步骤,旨在帮助初学者快速掌握生信项目的全流程操作,提升科研能力。

笔者认为,这套教程对于初学者而言,具有较高的实用价值和指导意义。通过系统学习,您可以更加清晰地了解生信项目的各个环节,掌握必备的技能和知识,为后续的研究工作打下坚实的基础。同时,笔者也相信,通过付费学习,您可以更加珍惜这套教程,更加投入地学习,取得更好的学习效果。

编译方法

本教程是在 RStudio IDE 内使用 Quarto 编辑的,Quarto 是继R Markdown之后,一个新的开源的科学和技术发布系统,它基于 Pandoc支持输出多种格式的书稿,比如 HTML 网页、EPUB 电子书、DOCX 文档和 PDF 便携式文档等。Quarto 吸收了过去 10 年 R Markdown 取得的经验和教训,在书籍写作、创建博客、制作简历和幻灯片等系列场景中支持更加统一的使用语法,一份源文档输出多种格式,使文档内容在不同场景中的迁移成本更低。了解更多 Quarto 特性,请访问 https://quarto.org/

书中 R 包名以粗体表示,如 knitr 包,函数名以等宽体表示,如 plot(),函数的参数名同理。代码块内注释用 # 表示,运行结果每一行开头以 #> 标记。本书写作过程中,依赖 knitr (Xie 2015)ggplot2 (Wickham 2016)lattice (Sarkar 2008) 等众多 R 包。考虑到要同时支持 DOCX、EPUB、PDF 和 HTML 四种书籍格式,书中使用 knitr 包和 gt 包制作静态的表格。

R包版本

在编写和生成这些书籍格式的过程中,使用了多个R语言包,并特别关注了这些包的版本信息以确保结果的准确性和兼容性。以下是涉及到的R包及其相应版本的详细说明:

xfun::session_info(packages = c(
  "dplyr", "tidyverse", "showtext", "data.table",
  "Biobase", "sva", "limma", "MicrobiomeAnalysis", 
  "SummarizedExperiment", "snm", "ggpubr", "cowplot",
  "gtsummary", "xlsx", "ComplexHeatmap", "circlize", 
  "ggplotify", "massdatabase", "clusterProfiler", 
  "org.Hs.eg.db", "enrichplot", "GSVA", "corrplot", 
  "RColorBrewer", "glmnet", "caret", "ROCR", 
  "pROC", "randomForest", "mlbench", "Boruta", 
  "Hmisc", "e1071", "ggvenn", "UpSetR", 
  "multipleROC", "ggdist", "gghalves",
  "ggpmisc", "ggExtra", "MLmetrics",
  "Seurat", "GseaVis", "ggh4x", 
  "ggunchull", "scCATCH", "SingleR", 
  "UCell", "rstatix", "viridis", 
  "immunedeconv", "ImmuCellAI"), 
  dependencies = FALSE)
#> R version 4.3.3 (2024-02-29)
#> Platform: aarch64-apple-darwin20 (64-bit)
#> Running under: macOS Sonoma 14.2
#> 
#> Locale: en_US.UTF-8 / en_US.UTF-8 / en_US.UTF-8 / C / en_US.UTF-8 / en_US.UTF-8
#> 
#> Package version:
#>   Biobase_2.62.0              Boruta_8.0.0               
#>   caret_6.0.94                circlize_0.4.16            
#>   clusterProfiler_4.10.1      ComplexHeatmap_2.18.0      
#>   corrplot_0.92               cowplot_1.1.3              
#>   data.table_1.15.4           dplyr_1.1.4                
#>   e1071_1.7.14                enrichplot_1.22.0          
#>   ggdist_3.3.2                ggExtra_0.10.1             
#>   ggh4x_0.2.8                 gghalves_0.1.4             
#>   ggplotify_0.1.2             ggpmisc_0.5.6              
#>   ggpubr_0.6.0                ggunchull_1.0.1            
#>   ggvenn_0.1.10               glmnet_4.1.8               
#>   GseaVis_0.1.0               GSVA_1.50.5                
#>   gtsummary_1.7.2             Hmisc_5.1.2                
#>   ImmuCellAI_0.1.0            immunedeconv_2.1.0         
#>   limma_3.58.1                massdatabase_1.0.10        
#>   MicrobiomeAnalysis_1.0.3    mlbench_2.1.5              
#>   MLmetrics_1.1.3             multipleROC_0.1.1          
#>   org.Hs.eg.db_3.18.0         pROC_1.18.5                
#>   randomForest_4.7.1.1        RColorBrewer_1.1.3         
#>   ROCR_1.0.11                 rstatix_0.7.2              
#>   scCATCH_3.2.2               Seurat_5.0.3               
#>   showtext_0.9.7              SingleR_2.4.1              
#>   snm_1.50.0                  SummarizedExperiment_1.32.0
#>   sva_3.50.0                  tidyverse_2.0.0            
#>   UCell_2.6.2                 UpSetR_1.4.0               
#>   viridis_0.6.5               xlsx_0.6.5

这些R包的选择和版本信息均经过仔细考量,旨在为用户提供稳定、高效且易于理解的书籍生成体验。请注意,由于R语言的生态系统持续发展,这些包的版本信息可能会有所更新。建议用户在实际使用中检查并更新到最新版本的R包,以获取最佳性能和最新的功能。

安装包

安装包

安装R包过程可能出现依赖包缺失的情况,需要耐心安装~

  • 通过CRAN安装的R包
cran_packages <- c("Boruta", "caret", "corrplot",
                   "cowplot", "data.table", "dplyr",
                   "ggplotify", "ggpubr", "glmnet",
                   "gtsummary", "Hmisc", "mlbench",
                   "pROC", "showtext", "RColorBrewer",
                   "ROCR", "randomForest", "xlsx",
                   "devtools", "remotes", "ggExtra",
                   "e1071", "ggdist", "ggh4x",
                   "ggpmisc", "ggvenn", "MLmetrics",
                   "rstatix", "scCATCH", "Seurat",
                   "UpSetR", "viridis")

for (i in cran_packages) {
  
  p_in <- installed.packages()
  p_names <- rownames(p_in)
  
  if (!i %in% p_names) {
    install.packages(i, dependencies = T)
  }
}
  • 通过bioconductor安装的R包
bio_packages <- c("Biobase", "circlize", "clusterProfiler", 
                  "enrichplot", "GSVA", "limma", 
                  "org.Hs.eg.db", "snm", "sva", 
                  "tidyverse", "UCell")

for (j in bio_packages) {
  
  p_in <- installed.packages()
  p_names <- rownames(p_in)
  
  if (!j %in% p_names) {
    BiocManager::install(j)
  }
}
  • 可能会用到的开发版R包
remotes::install_github("tidymass/massdatabase")
devtools::install_github("bryandmartin/corncob")
devtools::install_github("HuaZou/MicrobiomeAnalysis", 
                         dependencies = c("Depends", "Imports", "LinkingTo"),
                         repos = c("https://cloud.r-project.org/",
                                   BiocManager::repositories()))
devtools::install_github('erocoar/gghalves')
devtools::install_github("sajuukLyu/ggunchull", type = "source")
devtools::install_github("junjunlab/GseaVis")
remotes::install_github("cardiomoon/multipleROC")
devtools::install_github('dviraran/SingleR')
remotes::install_github("omnideconv/immunedeconv")
  • 可能会用到的需要手动下载的R包
install.packages("ImmuCellAI_0.1.0.tar.gz", repos = NULL, type = "source")

版权

首先,我衷心感谢您对本书的关注与支持。本书是我倾注心血与智慧的结晶,每一页都承载着我对知识的尊重与热爱。

禁止任何形式的盗版行为。盗版不仅侵犯了我的合法权益,更是对作者创作成果的不尊重。我呼吁广大读者自觉抵制盗版,选择正规渠道购买正版书籍,共同维护一个健康、有序的版权环境。

购买后的书籍属于您的个人财产,但您不得将其进行二次销售或用于商业用途。请在使用本书内容时,遵守相关的版权法律法规,不得擅自复制、传播、修改或用于其他未经授权的用途。

知识产权是创新的重要基石,也是推动社会进步的重要力量。让我们携手共同尊重和保护知识产权,为构建一个更加美好的未来贡献力量。

再次感谢您的关注与支持,祝您生活愉快!

售价

本教程整体售价998元。可通过微信交易。本产品一经售出,不接受任何形式的退款申请。请大家在购买前仔细考虑,确保您已充分了解教程的内容并认同交易规则。购买成功后,您将获得一个专属下载链接,链接中包含以下丰富的学习材料:

  • 教程说明:HTML/PDF格式的详细、系统的教程说明,旨在引导您逐步掌握相关知识,并帮助您解决在学习过程中可能遇到的问题。

  • 配套代码:与教程说明一一对应,确保您在学习理论知识的同时,能够通过实践加深对知识点的理解。代码质量高,注释清晰,易于理解和使用。

  • 配套数据:本教程所需要用到的所有数据,需注意数据所处的目录位置。

关注微信公众号生信学习者或添加Lavender_George,在菜单栏找到购买教程链接,付费后即可获得所有材料的下载链接。

最后温馨提示。请在购买前确认您的支付账户余额充足,以确保交易顺利完成。购买成功后,请务必妥善保管您的下载链接(有效期7天,在有效期内若链接有问题,请随时和我联系),以便随时访问和下载所需材料。

答疑

感谢您对本书的关注与购买。在此,我需要明确说明关于本书购买后的答疑服务相关事宜。

本次出售的教程仅包含书籍本身的内容,即书籍中的文字、图片等所呈现的知识与信息,不包括提供专门的答疑解惑服务。尽管我未提供专门的答疑解惑服务,但考虑到读者的学习需求,对于相对简单且不占据我过多时间的问题,我将酌情提供免费答疑。这类问题通常指那些不涉及复杂分析、计算或深入讨论的问题,且能够迅速得到解答。如有需要,您可以通过我的微信号(Lavender_George)提出您的问题。我会尽快查看并回复您的问题,但请注意,由于时间和精力的限制,我无法对所有问题都提供即时的详细解答。

请读者朋友们在购买前仔细阅读以上说明,确保您已了解购买服务的具体内容。鼓励您通过自主学习和查阅相关资料等方式解决学习中遇到的问题。如有需要,您还可以考虑购买我提供的其他增值服务,以获得更专业的指导和帮助。