欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

R語言 實(shí)現(xiàn)兩表連接且輸出不重復(fù)數(shù)據(jù)

 更新時(shí)間:2021年03月27日 17:25:50   作者:Watch_dou  
這篇文章主要介紹了R語言 實(shí)現(xiàn)兩表連接且輸出不重復(fù)數(shù)據(jù)的操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

在做項(xiàng)目中遇到了如此問題,其中整理的結(jié)果表中沒有會(huì)員ID信息,只有會(huì)員電話號(hào)碼信息,且每一行為唯一一個(gè)會(huì)員。

另外一張member表中包含會(huì)員ID以及會(huì)員電話信息,但是這張表有重復(fù)的會(huì)員信息,也就是說一個(gè)會(huì)員在member表中多次出現(xiàn),memeber表比整理的表要大很多。

說明:

1.在項(xiàng)目過程中,數(shù)據(jù)量較大,用到的是data.table包,需要用到SQL中的語句減少代碼量,因此需要sqldf包。

2.以下例子中xx中的a1在yy中都有對(duì)應(yīng)的值。

3.yy中的a1與b是一一對(duì)應(yīng)的關(guān)系,不存在同一個(gè)a1值對(duì)應(yīng)不同的b值。

4.此程序的目的是,用yy表與xx表匹配,也就是最終的結(jié)果應(yīng)該是在xx的基礎(chǔ)上增加b這一列的信息,數(shù)據(jù)集xx的行數(shù)不變。

如下所示:

<span style="font-size:14px;">> library(data.table)
> library(sqldf)
> xx <- data.table(a1=1:6,c=c(8,5,8,6,23,7),d=c('adf','af','sdf','utr','af','ruti'))</span>
<span style="font-family:SimSun;font-size:14px;">> xx
  a1 c  d
1: 1 8 adf
2: 2 5  af
3: 3 8 sdf
4: 4 6 utr
5: 5 23  af
6: 6 7 ruti</span>
<span style="font-size:14px;">yy <- data.table(a1=c(2,3,1,4,5,5,7,6,8,9,2,2,3,6),b=c('b','c','a','d','e','e','g',
                            'f','h','i','b','b','c','f'))</span>
<span style="font-size:14px;">> yy
  a1 b
 1: 2 b
 2: 3 c
 3: 1 a
 4: 4 d
 5: 5 e
 6: 5 e
 7: 7 g
 8: 6 f
 9: 8 h
10: 9 i
11: 2 b
12: 2 b
13: 3 c
14: 6 f
</span>
<span style="font-size:14px;">#按照a1連接所有信息包括進(jìn)去 
> dataxy<- merge(xx, yy, by = "a1", all.x = TRUE)
> dataxy 
  a1 c  d b
 1: 1 8 adf a
 2: 2 5  af b
 3: 2 5  af b
 4: 2 5  af b
 5: 3 8 sdf c
 6: 3 8 sdf c
 7: 4 6 utr d
 8: 5 23  af e
 9: 5 23  af e
10: 6 7 ruti f
11: 6 7 ruti f</span>
<span style="font-size:14px;">#刪除重復(fù)的行*/ 
> sqldf("select DISTINCT a1,b,c,d from left1")
 a1 b c  d
1 1 a 8 adf
2 2 b 5  af
3 3 c 8 sdf
4 4 d 6 utr
5 5 e 23  af
6 6 f 7 ruti</span>

補(bǔ)充:R語言篩選出不重復(fù)的行的幾種方法

在做項(xiàng)目的過程中遇到篩選不重復(fù)的會(huì)員信息進(jìn)行匹配,本次介紹五種篩選不重復(fù)行的數(shù)據(jù):

五種方法如下:

>>> library(dplyr)
>>> library(sqldf)

方法一:

>>> data1 <- data7_0 %>% 
       group_by(CELLPHONE,MEMBERID) %>%
       filter(row_number() == 1) %>%
       ungroup()

方法二:

>>> data2 <- data7_0 %>% 
       distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)

方法三:

>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")

方法四:

>>> data4 <- base::unique(data7_0)

方法五:

>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ]) 

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

  • R語言學(xué)習(xí)筆記缺失數(shù)據(jù)的Bootstrap與Jackknife方法

    R語言學(xué)習(xí)筆記缺失數(shù)據(jù)的Bootstrap與Jackknife方法

    這篇文章主要為大家介紹了R語言學(xué)習(xí)筆記關(guān)于缺失數(shù)據(jù)的Bootstrap與Jackknife的方法,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步
    2021-11-11
  • R語言 數(shù)據(jù)集行列互換的技巧分享

    R語言 數(shù)據(jù)集行列互換的技巧分享

    這篇文章主要介紹了R語言 數(shù)據(jù)集行列互換的技巧分享,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • R語言ggplot在熱圖上標(biāo)注相關(guān)系數(shù)的操作方法

    R語言ggplot在熱圖上標(biāo)注相關(guān)系數(shù)的操作方法

    R語言是一種開源、免費(fèi)的編程語言,主要用于統(tǒng)計(jì)分析、圖形化和機(jī)器學(xué)習(xí),這篇文章主要介紹了R語言ggplot怎么在熱圖上標(biāo)注相關(guān)系數(shù),需要的朋友可以參考下
    2024-07-07
  • R語言基本對(duì)象類型知識(shí)點(diǎn)詳解

    R語言基本對(duì)象類型知識(shí)點(diǎn)詳解

    在本篇文章里小編給大家整理了一篇關(guān)于R語言基本對(duì)象類型知識(shí)點(diǎn)詳解內(nèi)容,有興趣的朋友們學(xué)習(xí)下。
    2021-03-03
  • R語言中quantile()函數(shù)的用法說明

    R語言中quantile()函數(shù)的用法說明

    這篇文章主要介紹了R語言中quantile()函數(shù)的用法說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-04-04
  • R語言 實(shí)現(xiàn)將factor轉(zhuǎn)換成numeric方法

    R語言 實(shí)現(xiàn)將factor轉(zhuǎn)換成numeric方法

    這篇文章主要介紹了R語言 實(shí)現(xiàn)將factor轉(zhuǎn)換成numeric方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • R語言ggplot2實(shí)現(xiàn)將多個(gè)照片拼接到一起

    R語言ggplot2實(shí)現(xiàn)將多個(gè)照片拼接到一起

    本文主要介紹了R語言ggplot2實(shí)現(xiàn)將多個(gè)照片拼接到一起,文中通過示例代碼介紹的非常詳細(xì),需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-07-07
  • R語言是什么 R語言簡介

    R語言是什么 R語言簡介

    R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、開源的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具
    2021-03-03
  • R語言利用plot()函數(shù)畫圖的基本用法

    R語言利用plot()函數(shù)畫圖的基本用法

    這篇文章主要給大家介紹了關(guān)于R語言利用plot()函數(shù)畫圖的基本用法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-03-03
  • 詳解R語言caret包trainControl函數(shù)

    詳解R語言caret包trainControl函數(shù)

    這篇文章主要介紹了R語言caret包trainControl函數(shù)詳解,本文通過源碼分析給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2022-08-08

最新評(píng)論