python處理csv中的空值方法
更新時(shí)間:2018年06月22日 09:49:41 作者:勿在浮沙筑高臺(tái)LS
今天小編就為大家分享一篇python處理csv中的空值方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
如下所示:
# -*- coding: UTF-8 -*- import jieba.posseg import tensorflow as tf import pandas as pd import csv import math """ 1.必須獲取CSV文件夾(ID:文本) 2.返回(ID:分詞后的文本) """ flags = tf.app.flags flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加訓(xùn)練數(shù)據(jù)文件") flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成結(jié)果數(shù)據(jù)文件") FLAGS = tf.app.flags.FLAGS def cut_word(train_data): """ 把數(shù)據(jù)按照行進(jìn)行遍歷,然后把結(jié)果按照行寫在csv中 :return:分詞結(jié)果list """ jieba.load_userdict("newdict.txt") with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile: writer = csv.writer(csvfile) for row in train_data.index: datas = train_data.loc[row].values[1] if isinstance(datas,str) or not math.isnan(datas): words = jieba.posseg.cut(datas) line = '' for word in words: line = line + word.word + " " writer.writerow([train_data.loc[row].values[0], line]) def main(_): data = pd.read_csv(FLAGS.train_file_address) cut_word(data) if __name__ == "__main__": tf.app.run(main)
以上這篇python處理csv中的空值方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
PyTorch使用GPU訓(xùn)練的兩種方法實(shí)例
pytorch是一個(gè)非常優(yōu)秀的深度學(xué)習(xí)的框架,具有速度快,代碼簡潔,可讀性強(qiáng)的優(yōu)點(diǎn),下面這篇文章主要給大家介紹了關(guān)于PyTorch使用GPU訓(xùn)練的兩種方法,需要的朋友可以參考下2022-05-05Python畫柱狀統(tǒng)計(jì)圖操作示例【基于matplotlib庫】
這篇文章主要介紹了Python畫柱狀統(tǒng)計(jì)圖操作,結(jié)合實(shí)例形式分析了Python基于matplotlib庫實(shí)現(xiàn)圖形繪制的相關(guān)操作技巧,需要的朋友可以參考下2018-07-07一文搞懂Python中pandas透視表pivot_table功能
透視表是一種可以對數(shù)據(jù)動(dòng)態(tài)排布并且分類匯總的表格格式?;蛟S大多數(shù)人都在Excel使用過數(shù)據(jù)透視表,也體會(huì)到它的強(qiáng)大功能,而在pandas中它被稱作pivot_table,今天通過本文給大家介紹Python中pandas透視表pivot_table功能,感興趣的朋友一起看看吧2021-11-11