python 浮點數(shù)四舍五入需要注意的地方
本文主要分享基于python的數(shù)據(jù)分析三方庫pandas,numpy的一次爬坑經(jīng)歷,發(fā)現(xiàn)并分析了python語言對于浮點數(shù)精度處理不準(zhǔn)確的問題,并在最后給出合理的解決方案。如果你也在用python處理數(shù)據(jù),建議看一下,畢竟0.1的誤差都可能造成比較大的影響。
問題出現(xiàn)
早上到了公司,領(lǐng)導(dǎo)發(fā)了幾個文件過來,說這兩天測試環(huán)境跑出來的數(shù)據(jù),與實際情況有所出入,看看哪出的問題,盡快解決···
開始排查
先對比數(shù)據(jù),發(fā)現(xiàn)并不是所有的數(shù)據(jù)都出現(xiàn)問題,只有10%左右的數(shù)據(jù)有這個問題,說明應(yīng)該不是邏輯上的問題,初步判斷可能為個別情況需要特殊處理,考慮不周導(dǎo)致
檢查梳理各個運算模塊,用debug斷點調(diào)試一波,確定了數(shù)據(jù)出現(xiàn)偏差的模塊
通過單獨測試這個單元模塊最終確定,涉及到兩數(shù)相除結(jié)果為0.5(浮點數(shù))的地方有問題
預(yù)期結(jié)果:np.round(0.5)=1,實際運算結(jié)果:np.round(0.5)=0,于是我做了如下的試驗
# 基于python3.7版本 >>> import numpy as np # 先看看 0 < x < 1 這個范圍的結(jié)果,發(fā)現(xiàn)有問題 >>> np.round(0.50) 0.0 >>> np.round(0.51) 1.0 >>> np.round(0.49) 0.0 # 我擔(dān)心是不是只有小數(shù)點為.5的都會呈現(xiàn)這種問題,所以測試了 x > 1的結(jié)果,發(fā)現(xiàn)還是有問題 >>> np.round(1.5) 2.0 >>> np.round(2.5) 2.0 >>> np.round(3.5) 4.0 >>> np.round(4.5) 4.0
通過對比,發(fā)現(xiàn)確實涉及到.5的值會有些和預(yù)想的不同,看看啥原因
分析問題
確實發(fā)現(xiàn)了關(guān)于浮點數(shù)(.5出現(xiàn)了理解上的偏差),看看官方文檔怎么解釋這個現(xiàn)象
numpy.around(a, decimals=0, out=None)[source]
Evenly round to the given number of decimals.
# 對于恰好介于四舍五入的十進制值之間的中間值(.5),NumPy會四舍五入為最接近的偶數(shù)值。
# 因此1.5和2.5四舍五入為2.0,-0.5和0.5四舍五入為0.0,依此類推。
For values exactly halfway between rounded decimal values,
NumPy rounds to the nearest even value.
Thus 1.5 and 2.5 round to 2.0, -0.5 and 0.5 round to 0.0, etc.
# np.around使用快速但有時不精確的算法來舍入浮點數(shù)據(jù)類型。
# 對于正小數(shù),它等效于np.true_divide(np.rint(a * 10 **小數(shù)),10 **小數(shù)),
# 由于IEEE浮點標(biāo)準(zhǔn)[1]和 十次方縮放時引入的錯誤
np.around uses a fast but sometimes inexact algorithm to round floating-point datatypes.
For positive decimals it is equivalent to np.true_divide(np.rint(a * 10**decimals), 10**decimals),
which has error due to the inexact representation of decimal fractions in the IEEE floating point standard [1]
and errors introduced when scaling by powers of ten
- 其實也就是說:對于帶有.5這種剛好介于中間的值,返回的是相鄰的偶數(shù)值
- 白話解釋:如果一個數(shù)字帶有浮點數(shù)(.5),整數(shù)部分為偶數(shù),則返回這個偶數(shù);整數(shù)部分奇數(shù),則返回這個奇數(shù)+1的偶數(shù)
- 規(guī)律解釋:如果整數(shù)部分能夠整除2,則返回整數(shù)部分;如果整數(shù)部分不能整除2,則返回整數(shù)部分 +1
解決問題
先不做任何改動,看下數(shù)據(jù)誤差的情形
# 我們?yōu)榱讼瓤聪卢F(xiàn)象,構(gòu)造如下案例 import pandas as pd import numpy as np df = pd.DataFrame({"num1": [1, 1, 1.5, 5, 7.5], "num2": [2, 3, 1, 6, 3]}) df["真實值"] = df["num1"] / df["num2"] # 看下round函數(shù)過后的結(jié)果 df["偏差值"] = np.round(df["num1"] / df["num2"])
原始結(jié)果圖片如下
不做處理,期望值和偏差值不等的情況出現(xiàn)
我的解決方案
- 我根據(jù)我的精度要求,構(gòu)建精度范圍所需要保留的小數(shù)點的最后一位,通過這個數(shù)字是否為5,判斷是否需要向上取整
- 舉例來說,本案例中我只需要保留整數(shù)部分的數(shù)據(jù),那么我只需要確定小數(shù)點后第一位是否是數(shù)字5就可以了
上代碼
import pandas as pd import numpy as np import math df = pd.DataFrame({"除數(shù)": [1, 1, 1.5, 5, 7.5], "被除數(shù)": [2, 3, 1, 6, 3]}) # 記錄真實值 df["真實值"] = df["除數(shù)"] / df["被除數(shù)"] # 記錄整數(shù)部分 df["輔助整數(shù)列"] = df["真實值"].apply(lambda x: math.modf(x)[1]) # 記錄小數(shù)部分,因為我的最后結(jié)果精度為只保留整數(shù)部分,所以我只需要保留一個小數(shù)點位進行判斷是否需要進位操作 df["輔助小數(shù)列"] = df["真實值"].apply(lambda x: str(math.modf(x)[0]).split(".")[1][0]) # 小數(shù)點后的第一位是為5,則向上取整,不是5則調(diào)用原np.round就行了 df["期望值修正"] = df.apply(lambda x: x.輔助整數(shù)列 + 1 if (x.輔助小數(shù)列 == "5") else np.round(x.真實值), axis=1)
結(jié)果如下所示
以上就是python 四舍五入需要注意的地方的詳細(xì)內(nèi)容,更多關(guān)于python 四舍五入的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
python從網(wǎng)絡(luò)讀取圖片并直接進行處理的方法
這篇文章主要介紹了python從網(wǎng)絡(luò)讀取圖片并直接進行處理的方法,涉及cStringIO模塊模擬本地文件的使用技巧,需要的朋友可以參考下2015-05-05python實現(xiàn)的jpg格式圖片修復(fù)代碼
這篇文章主要介紹了python實現(xiàn)的jpg格式圖片修復(fù)代碼,本文直接給出實現(xiàn)代碼,需要的朋友可以參考下2015-04-04Python中ROS和OpenCV結(jié)合處理圖像問題
ROS通過一個叫CvBridge的功能包,將獲取的圖像數(shù)據(jù)轉(zhuǎn)換成OpenCV的格式,OpenCV處理之后,傳回給ROS進行圖像顯示(應(yīng)用),這篇文章主要介紹了Python中ROS和OpenCV結(jié)合處理圖像問題,需要的朋友可以參考下2022-06-06