R語言ComplexHeatmap繪制復(fù)雜熱圖heatmap
ComplexHeatmap|繪制單個(gè)熱圖介紹了單個(gè)熱圖繪制的內(nèi)容
一 載入R包 數(shù)據(jù)
1.1 載入ComplexHeatmap包,數(shù)據(jù)
為更貼近生信使用場(chǎng)景,直接使用內(nèi)置的基因表達(dá)數(shù)據(jù)
library(ComplexHeatmap) expr = readRDS(paste0(system.file(package = "ComplexHeatmap"), "/extdata/gene_expression.rds")) #查看數(shù)據(jù) str(expr) expr[1:4,c(1:4,25:27)]
拿到一個(gè)新數(shù)據(jù)后,除了檢查[1:4,1:4]外,也許還需要看看最后幾列,另外還需要觀察列名稱的規(guī)律。
去除最后幾列,或者只選取列名字包含cell的(TCGA數(shù)據(jù)處理中也會(huì)經(jīng)常遇到)
mat = as.matrix(expr[, grep("cell", colnames(expr))])
1.2 繪制最簡(jiǎn)單的熱圖
Heatmap(mat)
二 常見“表型”注釋
文獻(xiàn)中經(jīng)常見到的就是在熱圖的top 或者 bottom位置添加樣本的變異信息,臨床信息等的注釋,本節(jié)介紹如何實(shí)現(xiàn)以及常見的設(shè)置。
2.1讀入注釋文件
anno <- read.csv("anno.csv",header = T) #非真實(shí)數(shù)據(jù),隨便設(shè)置 head(anno) sample stage age#1 s1_cell01 1 56#2 s2_cell02 2 43#3 s3_cell03 2 63#4 s4_cell01 3 23#5 s5_cell02 1 8#6 s6_cell03 3 3
2.2添加注釋,且設(shè)置顏色
2.2.1 顏色設(shè)置
1) 連續(xù)變量:指定色系,根據(jù)變量范圍設(shè)置顏色范圍
col_fun2 <- colorRamp2( c(0, 50, 100), #根據(jù)值的范圍設(shè)置 c("#ff7f00", "white", "#1f78b4") )
2)分類變量:直接指定顏色編碼
#stage = c("1" = "red", "2" = "green", "3" = "blue" , "4" = "orange") #分類
2.2.2 添加注釋
使用HeatmapAnnotation
函數(shù)進(jìn)行注釋,添加待注釋的內(nèi)容
ha <- HeatmapAnnotation( age = anno$age, stage = anno$stage, col = list( age = col_fun2 , #連續(xù) stage = c("1" = "red", "2" = "green", "3" = "blue" , "4" = "orange") #分類 ) )
1)注釋位置
#指定注釋位置 ,示例為top_annotation,此外可選 bottom_annotation ,right_annotation ,left_annotation
Heatmap( mat, top_annotation = ha )
熱圖上面注釋樣本的臨床等信息,實(shí)現(xiàn)!
2) 指定多個(gè)注釋位置
當(dāng)需要注釋的內(nèi)容較多時(shí)候,可以選擇在不同的位置。需要預(yù)先根據(jù)待注釋的位置進(jìn)行指定
column_ha <- HeatmapAnnotation( bar1 = anno_barplot(runif(24)) ) row_ha <- rowAnnotation( bar2 = expr$chr ) Heatmap( mat, show_row_names = F , #cluster_rows = F , top_annotation = ha , bottom_annotation = column_ha, #對(duì)應(yīng)的注釋 right_annotation = row_ha )
其他常用調(diào)整的函數(shù)
#cluster_rows/columns :是否進(jìn)行聚類
#show_column/row_dend :是否顯示聚類樹
#column/row_dend_side :聚類圖繪制的位置
#column_dend_height/row_dend_widht :聚類樹的高度 和 寬度
三 添加“塊”注釋
常見的是根據(jù)聚類(kmeans等)或者 先驗(yàn)知識(shí) 分為幾個(gè)簇,然后對(duì)簇進(jìn)行注釋。
3.1 k-means指定K個(gè)數(shù)
1)樣本設(shè)置分為4組,基因分為3組,同時(shí)設(shè)置每個(gè)“簇”的顏色和標(biāo)簽
set.seed(1234) Heatmap(mat, top_annotation = HeatmapAnnotation(foo = anno_block(gp = gpar(fill = 1:4), labels = c("group1", "group2", "group3", "group4"), labels_gp = gpar(col = "white", fontsize = 10))), column_km = 4, # 列分為4個(gè)k left_annotation = rowAnnotation(foo = anno_block(gp = gpar(fill = 2:4), labels = c("group1", "group2", "group3"), labels_gp = gpar(col = "white", fontsize = 10))), row_km = 3, # show_row_names = F )
2)設(shè)置 text的顏色
Heatmap(mat, top_annotation = HeatmapAnnotation(foo = anno_block(gp = gpar(fill = 1:4), labels = c("group1", "group2", "group3", "group4"), labels_gp = gpar(col = "white", fontsize = 10))), column_km = 4, left_annotation = rowAnnotation(foo = anno_block(gp = gpar(fill = 2:4), labels = c("group1", "group2", "group3"), labels_gp = gpar(col = "white", fontsize = 10))), row_km = 3, show_row_names = F , row_title_gp = gpar( col = rainbow(5)[2:4], font = 1:3 ), row_names_gp = gpar( col = rainbow(5)[2:4], fontsize = 10:12 ), column_title_gp = gpar( fill = rainbow(5)[1:4], alpha = 0.5 ), column_names_gp = gpar( col = rainbow(5)[1:4] ) )
關(guān)于顏色可選#rainbow,heat.colors,terrain.colors,topo.colors,cm.colors
3.2 先驗(yàn)知識(shí)知道樣本分為幾個(gè)簇
指定樣本添加列注釋,假設(shè)mat中的24個(gè)樣本,已知是分別為10個(gè),10個(gè) 和4個(gè)的三組 。
實(shí)際應(yīng)用中可以根據(jù) 年齡段,性別,臨床分析,預(yù)后評(píng)分等指標(biāo)進(jìn)行的分組。
split = c( rep(c("A","B"),10) , rep("C",4) ) ha = HeatmapAnnotation(foo = anno_block(gp = gpar(fill = 2:6), labels = c("AA","BB","CC") )) col_fun = colorRamp2(c(0, 5, 10, 20), c("white", "cornflowerblue", "yellow", "red"))
使用column_split 函數(shù)即可按照指定拆分
Heatmap(mat, name = "mat_cluster", column_split = split, top_annotation = ha, cluster_rows = T, cluster_columns = F, #rect_gp = gpar(col="white"), #添加白色格子線 column_title = NULL)
3.3 根據(jù)富集結(jié)果添加行注釋
文獻(xiàn)中經(jīng)常見到 一些基因富集的通路作為 行注釋的圖,怎么實(shí)現(xiàn)呢?
1)自定義通路結(jié)果(也可以是其他想展示的內(nèi)容)
group <- list( A = "Cell cycle", B = "Mismatch repair", C = "DNA replication" )
2)添加空白注釋
ha = rowAnnotation( foo = anno_empty( border = FALSE, # 計(jì)算空白注釋的寬度 width = max_text_width(unlist(group)) + unit(4, "mm")) )
3)通過向量拆分對(duì)應(yīng)的行和列
Heatmap(mat, name = "mat", #cluster_rows = T, show_row_names = F, right_annotation = ha, row_split = c( rep(c("A","B"),30) , rep("C",95) ) , column_split = rep(c("C", "D"), 12))
4)添加注釋塊 以及 注釋文本
for(i in 1:3) { decorate_annotation( "foo", # 選擇熱圖塊 slice = i, { # 添加顏色框 grid.rect( x = 0, width = unit(2, "mm"), gp = gpar( fill = rainbow(3)[i], col = NA ), just = "left" ) # 繪制文本 grid.text( group[[i]], x = unit(4, "mm"), gp = gpar( col = rainbow(3)[i] ), just = "left") }) }
需要注意的是 這里需要對(duì)應(yīng)好,各位有更好的方法希望不吝告知。
四 目標(biāo)基因分析
4.1 標(biāo)簽展示目標(biāo)基因
使用anno_mark()
函數(shù)展示目標(biāo)基因,至少需要兩個(gè)參數(shù),通過at 提供原始數(shù)據(jù)矩陣的索引,labels 為相應(yīng)的文本標(biāo)記。
1)讀取待展示的基因名稱,也可以是geneList的向量
name <- read.table('name.txt', header = T, check.names = FALSE) head(name) # gene#1 gene3#2 gene53#3 gene6#4 gene78#5 gene7#6 gene9
2)獲取目標(biāo)基因?qū)?yīng)的矩陣位置;
genelist <- name$gene index <- which(rownames(mat) %in% genelist) #得到對(duì)應(yīng)的文本標(biāo)簽; labs <- rownames(mat)[index]
3)使用labels_gp
調(diào)整字體大小;
lab2 = rowAnnotation(foo = anno_mark(at = index, labels = labs, labels_gp = gpar(fontsize = 8), lines_gp = gpar()))
標(biāo)簽展示目標(biāo)基因
Heatmap(mat, name = "mat", cluster_rows = T, right_annotation = lab2, row_names_side = "right", show_row_names = F, row_names_gp = gpar(fontsize = 4))
4.2 繪制目標(biāo)基因熱圖
大部分熱圖存在基因太多的情況,重點(diǎn)展示目的基因 。
heatmap4 <- Heatmap( mat, name = "expression" ) heatmap
4.2.1 在總圖中提取出來目標(biāo)基因的熱圖,顏色與大圖一致
提取目的基因所在的位置進(jìn)行繪制
heatmaph4[c(1,5,6,8,9,80,144,74),]
這種方式是在總的熱圖中直接提取目的基因的部分,熱圖的顏色與總的熱圖一致。
4.2.2 提取基因數(shù)據(jù)重新繪制熱圖
labs2 <- c("gene1", "gene5", "gene6", "gene8", "gene9", "gene80" ,"gene144", "gene74") mat2 <- as.data.frame(mat) %>% rownames_to_column("gene") %>% filter( gene %in% labs2 ) %>% column_to_rownames("gene") Heatmap(mat2)
注意區(qū)別
參考資料:
https://jokergoo.github.io/ComplexHeatmap-reference/book/a-single-heatmap.html
注釋及基因文件均為隨便設(shè)置的,可根據(jù)數(shù)據(jù)情況自行更改
以上就是R語言ComplexHeatmap繪制復(fù)雜熱圖heatmap的詳細(xì)內(nèi)容,更多關(guān)于R語言ComplexHeatmap熱圖的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
R語言學(xué)習(xí)ggplot2繪制統(tǒng)計(jì)圖形包全面詳解
這篇文章主要為大家詳細(xì)介紹了R語言學(xué)習(xí)ggplot2繪制統(tǒng)計(jì)圖形包的全面知識(shí)講解,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-11-11Rcpp和RcppArmadillo創(chuàng)建R語言包的實(shí)現(xiàn)方式
這篇文章主要為大家介紹了Rcpp和RcppArmadillo創(chuàng)建R包實(shí)現(xiàn)方式,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2021-11-11R語言數(shù)值取消科學(xué)計(jì)數(shù)法表示的操作
這篇文章主要介紹了R語言數(shù)值取消科學(xué)計(jì)數(shù)法表示的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-04-04R語言 用均值替換、回歸插補(bǔ)及多重插補(bǔ)進(jìn)行插補(bǔ)的操作
這篇文章主要介紹了R語言 用均值替換、回歸插補(bǔ)及多重插補(bǔ)進(jìn)行插補(bǔ)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-03-03R語言繪制corrplot相關(guān)熱圖分析美化示例及詳細(xì)圖解
這篇文章主要為大家介紹了R語言corrplot相關(guān)熱圖分析美化示例及詳細(xì)圖解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06R語言實(shí)現(xiàn)各種數(shù)據(jù)可視化的超詳細(xì)教程
Python語言越來越流行,尤其是在機(jī)器學(xué)習(xí)與深度學(xué)習(xí)等領(lǐng)域,但是R語言在數(shù)據(jù)分析與可視化方面仍然具有絕對(duì)的優(yōu)勢(shì),下面這篇文章主要給大家介紹了關(guān)于R語言實(shí)現(xiàn)各種數(shù)據(jù)可視化的超詳細(xì)教程,需要的朋友可以參考下2022-11-11