python處理csv中的空值方法
更新時間:2018年06月22日 09:49:41 作者:勿在浮沙筑高臺LS
今天小編就為大家分享一篇python處理csv中的空值方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
如下所示:
# -*- coding: UTF-8 -*-
import jieba.posseg
import tensorflow as tf
import pandas as pd
import csv
import math
"""
1.必須獲取CSV文件夾(ID:文本)
2.返回(ID:分詞后的文本)
"""
flags = tf.app.flags
flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加訓(xùn)練數(shù)據(jù)文件")
flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成結(jié)果數(shù)據(jù)文件")
FLAGS = tf.app.flags.FLAGS
def cut_word(train_data):
"""
把數(shù)據(jù)按照行進(jìn)行遍歷,然后把結(jié)果按照行寫在csv中
:return:分詞結(jié)果list
"""
jieba.load_userdict("newdict.txt")
with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile:
writer = csv.writer(csvfile)
for row in train_data.index:
datas = train_data.loc[row].values[1]
if isinstance(datas,str) or not math.isnan(datas):
words = jieba.posseg.cut(datas)
line = ''
for word in words:
line = line + word.word + " "
writer.writerow([train_data.loc[row].values[0], line])
def main(_):
data = pd.read_csv(FLAGS.train_file_address)
cut_word(data)
if __name__ == "__main__":
tf.app.run(main)
以上這篇python處理csv中的空值方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python畫柱狀統(tǒng)計圖操作示例【基于matplotlib庫】
這篇文章主要介紹了Python畫柱狀統(tǒng)計圖操作,結(jié)合實例形式分析了Python基于matplotlib庫實現(xiàn)圖形繪制的相關(guān)操作技巧,需要的朋友可以參考下2018-07-07
一文搞懂Python中pandas透視表pivot_table功能
透視表是一種可以對數(shù)據(jù)動態(tài)排布并且分類匯總的表格格式。或許大多數(shù)人都在Excel使用過數(shù)據(jù)透視表,也體會到它的強大功能,而在pandas中它被稱作pivot_table,今天通過本文給大家介紹Python中pandas透視表pivot_table功能,感興趣的朋友一起看看吧2021-11-11

