欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python按比例隨機(jī)切分?jǐn)?shù)據(jù)的實現(xiàn)

 更新時間:2019年07月11日 09:49:38   作者:HOU_JUN  
這篇文章主要介紹了python按比例隨機(jī)切分?jǐn)?shù)據(jù)的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

在機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)中,我們常常碰到一個問題是數(shù)據(jù)集的切分。比如在一個比賽中,舉辦方給我們的只是一個帶標(biāo)注的訓(xùn)練集和不帶標(biāo)注的測試集。其中訓(xùn)練集是用于訓(xùn)練,而測試集用于已訓(xùn)練模型上跑出一個結(jié)果,然后提交,然后舉辦方驗證結(jié)果給出一個分?jǐn)?shù)。但是我們在訓(xùn)練過程中,可能會出現(xiàn)過擬合等問題,會面臨著算法和模型的選擇,此時,驗證集就顯得很重要。通常,如果數(shù)據(jù)量充足,我們會從訓(xùn)練集中劃分出一定比例的數(shù)據(jù)來作為驗證集。

每次劃分?jǐn)?shù)據(jù)集都手動寫一個腳本,重復(fù)性太高,因此將此簡單的腳本放到自己的博客。代碼如下:

import random

def split(full_list,shuffle=False,ratio=0.2):
  n_total = len(full_list)
  offset = int(n_total * ratio)
  if n_total==0 or offset<1:
    return [],full_list
  if shuffle:
    random.shuffle(full_list)
  sublist_1 = full_list[:offset]
  sublist_2 = full_list[offset:]
  return sublist_1,sublist_2


if __name__ == "__main__":
  li = range(5)
  sublist_1,sublist_2 = split(li,shuffle=True,ratio=0.2)

  print sublist_1,len(sublist_1)
  print sublist_2,len(sublist_2)

其中,main為測試代碼。假如訓(xùn)練集給出的是一個文件,我們先將文件讀到列表中,然后再調(diào)用split。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python中字符串轉(zhuǎn)換為列表的常用方法總結(jié)

    Python中字符串轉(zhuǎn)換為列表的常用方法總結(jié)

    本文將詳細(xì)介紹Python中將字符串轉(zhuǎn)換為列表的八種常用方法,每種方法都具有其獨特的用途和適用場景,文中的示例代碼講解詳細(xì),感興趣的可以了解下
    2023-11-11
  • Python中Numpy模塊使用詳解

    Python中Numpy模塊使用詳解

    這篇文章主要介紹了Python中Numpy模塊使用詳解,NumPy是Python 的一個擴(kuò)展程序庫,支持大量的維度數(shù)組與矩陣運算。更多相關(guān)內(nèi)容需要的朋友可以參考一下
    2022-07-07
  • Python實現(xiàn)強(qiáng)制復(fù)制粘貼的示例詳解

    Python實現(xiàn)強(qiáng)制復(fù)制粘貼的示例詳解

    下個文檔還要馬內(nèi)?還好我會Python,本文就來教大家來一手如何利用Python實現(xiàn)強(qiáng)制復(fù)制粘貼。文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下
    2022-12-12
  • Python判斷和循環(huán)語句的分析與應(yīng)用

    Python判斷和循環(huán)語句的分析與應(yīng)用

    判斷語句是用來篩選條件,過濾條件的。循環(huán)語句是用來解決重復(fù)性代碼的問題,提高工作效率。今天的知識點不多,耐心看完吧
    2022-07-07
  • python中操作文件的模塊的方法總結(jié)

    python中操作文件的模塊的方法總結(jié)

    在本篇文章里小編給大家整理的是一篇關(guān)于python中操作文件的模塊的方法總結(jié),有需要的朋友們可以學(xué)習(xí)參考下。
    2021-02-02
  • matplotlib subplot繪制多個子圖的方法示例

    matplotlib subplot繪制多個子圖的方法示例

    這篇文章主要介紹了matplotlib subplot繪制多個子圖的方法示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-07-07
  • 用Python編程實現(xiàn)語音控制電腦

    用Python編程實現(xiàn)語音控制電腦

    是否經(jīng)常好萊塢電影里看強(qiáng)大的語音識別系統(tǒng)? 是否每每看到都會羨慕嫉妒恨? 可是我們真心買不起啊。
    2014-04-04
  • Python爬取網(wǎng)易云歌曲評論實現(xiàn)詞云圖

    Python爬取網(wǎng)易云歌曲評論實現(xiàn)詞云圖

    這篇文章主要為大家介紹了Python爬取網(wǎng)易云歌曲評論實現(xiàn)詞云分析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-06-06
  • python實現(xiàn)簡單飛機(jī)大戰(zhàn)小游戲

    python實現(xiàn)簡單飛機(jī)大戰(zhàn)小游戲

    這篇文章主要為大家詳細(xì)介紹了python實現(xiàn)簡單飛機(jī)大戰(zhàn)小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-05-05
  • Python中的pickle模塊解析

    Python中的pickle模塊解析

    這篇文章主要介紹了Python中的pickle模塊解析,pickle 模塊和 json 模塊很像,都有序列化的功能,不過 pickle 模塊更加局限一些只能對 python 使用,它可以對一個 python 對象結(jié)構(gòu)的二進(jìn)制序列化和反序列化,需要的朋友可以參考下
    2023-09-09

最新評論