python處理兩種分隔符的數據集方法
更新時間:2018年12月12日 10:16:32 作者:uvwxyzhao
今天小編就為大家分享一篇python處理兩種分隔符的數據集方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
在做機器學習的時候,遇到這樣一個數據集...
一共399行10列,
1-9列是用不定長度的空格分割,
第9-10列之間用'\t'分割,
前九列都是數值類型,其中第三列有若干個'?'填充的缺失值...
第十列是字符串類型,..
部分數據截圖:
之前我是用python強寫的...很麻煩,代碼如下:
至此,可以已平均值,填充缺失值...
今天再回顧此數據庫;決定用pandas庫來試試;
1,導包,用pandas.read_table導入數據集,
2,數據處理
最后輸出如下:
以上這篇python處理兩種分隔符的數據集方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python+OpenCV數字圖像處理之ROI區(qū)域的提取
ROI區(qū)域又叫感興趣區(qū)域。在機器視覺、圖像處理中,從被處理的圖像以方框、圓、橢圓、不規(guī)則多邊形等方式勾勒出需要處理的區(qū)域,稱為感興趣區(qū)域,ROI。本文主要為大家介紹如何通過Python+OpenCV提取ROI區(qū)域,需要的朋友可以了解一下2021-12-12