python按比例隨機切分數(shù)據(jù)的實現(xiàn)

更新時間：2019年07月11日 09:49:38 作者：HOU_JUN

這篇文章主要介紹了python按比例隨機切分數(shù)據(jù)的實現(xiàn)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

在機器學習或者深度學習中，我們常常碰到一個問題是數(shù)據(jù)集的切分。比如在一個比賽中，舉辦方給我們的只是一個帶標注的訓練集和不帶標注的測試集。其中訓練集是用于訓練，而測試集用于已訓練模型上跑出一個結果，然后提交，然后舉辦方驗證結果給出一個分數(shù)。但是我們在訓練過程中，可能會出現(xiàn)過擬合等問題，會面臨著算法和模型的選擇，此時，驗證集就顯得很重要。通常，如果數(shù)據(jù)量充足，我們會從訓練集中劃分出一定比例的數(shù)據(jù)來作為驗證集。

每次劃分數(shù)據(jù)集都手動寫一個腳本，重復性太高，因此將此簡單的腳本放到自己的博客。代碼如下：

import random

def split(full_list,shuffle=False,ratio=0.2):
  n_total = len(full_list)
  offset = int(n_total * ratio)
  if n_total==0 or offset<1:
    return [],full_list
  if shuffle:
    random.shuffle(full_list)
  sublist_1 = full_list[:offset]
  sublist_2 = full_list[offset:]
  return sublist_1,sublist_2


if __name__ == "__main__":
  li = range(5)
  sublist_1,sublist_2 = split(li,shuffle=True,ratio=0.2)

  print sublist_1,len(sublist_1)
  print sublist_2,len(sublist_2)

其中，main為測試代碼。假如訓練集給出的是一個文件，我們先將文件讀到列表中，然后再調用split。

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python中字符串轉換為列表的常用方法總結
本文將詳細介紹Python中將字符串轉換為列表的八種常用方法,每種方法都具有其獨特的用途和適用場景,文中的示例代碼講解詳細,感興趣的可以了解下
2023-11-11
Python中Numpy模塊使用詳解
這篇文章主要介紹了Python中Numpy模塊使用詳解，NumPy是Python 的一個擴展程序庫，支持大量的維度數(shù)組與矩陣運算。更多相關內容需要的朋友可以參考一下
2022-07-07
Python實現(xiàn)強制復制粘貼的示例詳解
下個文檔還要馬內？還好我會Python，本文就來教大家來一手如何利用Python實現(xiàn)強制復制粘貼。文中的示例代碼講解詳細，感興趣的小伙伴可以了解一下
2022-12-12
Python判斷和循環(huán)語句的分析與應用
判斷語句是用來篩選條件，過濾條件的。循環(huán)語句是用來解決重復性代碼的問題，提高工作效率。今天的知識點不多，耐心看完吧
2022-07-07
python中操作文件的模塊的方法總結
在本篇文章里小編給大家整理的是一篇關于python中操作文件的模塊的方法總結，有需要的朋友們可以學習參考下。
2021-02-02
matplotlib subplot繪制多個子圖的方法示例
這篇文章主要介紹了matplotlib subplot繪制多個子圖的方法示例，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-07-07
用Python編程實現(xiàn)語音控制電腦
是否經常好萊塢電影里看強大的語音識別系統(tǒng)? 是否每每看到都會羨慕嫉妒恨？可是我們真心買不起啊。
2014-04-04
Python爬取網易云歌曲評論實現(xiàn)詞云圖
這篇文章主要為大家介紹了Python爬取網易云歌曲評論實現(xiàn)詞云分析，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2022-06-06
python實現(xiàn)簡單飛機大戰(zhàn)小游戲
這篇文章主要為大家詳細介紹了python實現(xiàn)簡單飛機大戰(zhàn)小游戲，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-05-05
Python中的pickle模塊解析
這篇文章主要介紹了Python中的pickle模塊解析,pickle 模塊和 json 模塊很像,都有序列化的功能,不過 pickle 模塊更加局限一些只能對 python 使用,它可以對一個 python 對象結構的二進制序列化和反序列化,需要的朋友可以參考下
2023-09-09