腳本之家服務器常用軟件

快捷導航

軟件下載

android MAC 驅(qū)動下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語言 Delphi Android

網(wǎng)絡編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國CMS WordPress

常用工具

PHP開發(fā)工具 python Photoshop 必備軟件

R語言列篩選的方法select實例詳解

更新時間：2022年07月14日 11:47:10 作者：育種數(shù)據(jù)分析之放飛自我

對于大數(shù)據(jù),linux和python是很好的處理工具,但是對于這兩個語言不熟悉的盆友來說,R語言是非常好的替代工具,下面這篇文章主要給大家介紹了關于R語言列篩選的法select的相關資料,需要的朋友可以參考下

前言

我們知道，R語言學習，80%的時間都是在清洗數(shù)據(jù)，而選擇合適的數(shù)據(jù)進行分析和處理也至關重要，如何選擇合適的列進行分析，你知道幾種方法？

如何優(yōu)雅高效的選擇合適的列，讓我們一起來看一下吧。

1. 數(shù)據(jù)描述

數(shù)據(jù)來源是我編寫的R包learnasreml中的fm數(shù)據(jù)集。

r$> library(learnasreml)

r$> data(fm)

r$> head(fm)

我們的目的：

提取fm的TreeID，Rep，dj，dm，h3，并重命名為：ID, F1, y1 , y2, y3

2. 使用R語言默認的方法：列選擇

這一種，當然是簡單粗暴的方法，想要哪一列，就把相關的列號提取出來，形成一個向量，進行操作即可。比如

r$> d1 = fm[,c(1,3,6,7,11)]

r$> head(d1)
  TreeID Rep    dj    dm  h3
1  80001   1 0.334 0.405 239
2  80002   1 0.348 0.393 242
3  80004   1 0.354 0.429 180
4  80005   1 0.335 0.408 301
5  80008   1 0.322 0.372 271
6  80026   1 0.359 0.450 258

r$> names(d1) = c("ID","F1","y1","y2","y3")

r$> head(d1)

結果：

缺點：

這種方法，需要找到性狀所在的列號，然后還要重命名，比較麻煩。

而且，后面如果想要根據(jù)列的特征進行提取時（比如以h開頭的列，比如屬性為數(shù)字或者因子的列等等），就不能實現(xiàn)了。

這就要用到tidyverse的函數(shù)了，select，rename，都是一等一的良將。

3. tidyverse的rename函數(shù)

代碼：

a2 = fm %>% rename(ID=TreeID, F1 = Rep, y1 = dj, y2 = dm, y3 = h3)

這里，rename只是單獨的修改名稱，并沒有提取出來。

還要使用select進一步的提?。?/p>

4. tidyverse的select函數(shù)

如果使用select函數(shù)，一行代碼就可以搞定：

a1 = fm %>% select(ID=TreeID, F1 = Rep, y1 = dj, y2 = dm, y3 = h3)

5. select函數(shù)注意事項

常見的坑：

注意，MASS包中也有select函數(shù)，而且優(yōu)先級更高，如果你載入了MASS包，select就不能使用了。

哪怕你再次載入tidyverse包，也不行：

載入dplyr包，也不行：

MASS就是這么豪橫。

像這種情況，解決辦法有兩種：

5.1 絕對引用函數(shù)

即使用select時，要用dplyr::select

a3 = a2 %>% dplyr::select(ID,F1,y1,y2,y3)

這樣也比較麻煩。

5.2 放到環(huán)境變量中

推薦的方法：

r$> select = dplyr::select

r$> a3 = a2 %>% select(ID,F1,y1,y2,y3)

推薦在載入包時，將下面代碼放在開頭，就可以肆無忌憚的應用select了，畢竟，環(huán)境變量的優(yōu)先級是第一位的。

library(tidyverse)
select = dplyr::select

6. 提取h開頭的列

這里，用starts_with，會匹配開頭為h的列。

其它還有contains，匹配包含的字符，還有end_with，匹配結尾的字符。

應有盡有，無所不有。

re1 = fm %>% select(starts_with("h"))

7. 提取因子和數(shù)字的列

匹配數(shù)字的列：

re2 = fm %>% select_if(is.numeric)

匹配為因子的列：

re3 = fm %>% select_if(is.factor)

總結

到此這篇關于R語言列篩選的方法select的文章就介紹到這了,更多相關R語言列篩選select內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片