快捷導(dǎo)航

C++中double浮點(diǎn)數(shù)精度丟失的深入分析

更新時(shí)間：2021年01月05日 16:07:12 作者：adanus

這篇文章主要給大家介紹了關(guān)于C++中double浮點(diǎn)數(shù)精度丟失的相關(guān)資料，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

看了一篇關(guān)于C/C++浮點(diǎn)數(shù)的博文，在Win32下，把int, 指針地址,long等4字節(jié)整數(shù)賦給一個(gè)double后，再用該double數(shù)賦給原始類型的數(shù)，得到的結(jié)果于最初的數(shù)值一致，即不存在任何精度丟失。例如下面的結(jié)果將總是true:

 long a=123456; //assign any long number here
 double db=a;
 long b=db;
 printf("%s\n",a==b?"true":"false");

但是對(duì)于long long或win64下的指針地址等8字節(jié)整數(shù)將存在精度丟失，于是對(duì)這方面做了一個(gè)簡(jiǎn)單的測(cè)試：

#include<iostream>
#include<stdlib.h>

void showEncodeOfDouble(unsigned char* db){

 const int ByteLength=8; 
 for(int i=ByteLength-1;i>=0;i--) 
  printf(" %.2x",db[i]);

 printf("\n");

}


int main(){
 
 unsigned long long maxULL=0xffffffffffffffff; //2^64-1=18446744073709551615,
             //max unsigned long long
 printf("%llu\n",maxULL);

 double d1=maxULL;        //20bit Significant,Precision Loss 
 printf("%f\n",d1);      

 maxULL=d1;
 printf("%llu\n",maxULL);
 
 showEncodeOfDouble((unsigned char*)&d1);

 system("pause");
 return 0;
}

輸出的結(jié)果如下（visual studio,win32）：

18446744073709551615
18446744073709552000.000000
9223372036854775808
43 f0 00 00 00 00 00 00

至此，有兩點(diǎn)疑問(wèn)（暫時(shí)不理會(huì)代碼中showEncodeOfDouble的結(jié)果）：

1）為什么丟失精度后得到的double數(shù)是18446744073709552000.000000？
2）為什么將double數(shù)重新轉(zhuǎn)化為unsigned long long后得到的數(shù)又和double不一致呢？

對(duì)于這兩個(gè)問(wèn)題，需要對(duì)C++浮點(diǎn)數(shù)的規(guī)格有一定的了解。

1 IEEE浮點(diǎn)標(biāo)準(zhǔn)

C/C++采用的是IEEE浮點(diǎn)標(biāo)準(zhǔn)，它以“二進(jìn)制的科學(xué)表示法”表示一個(gè)小數(shù)：

其中M是一個(gè)整數(shù)部分僅有一位的二進(jìn)制小數(shù)，例如1.011，表示十進(jìn)制下的1.375。E表示該小數(shù)以2為底時(shí)的階數(shù)?；谝陨系谋硎痉绞?，小數(shù)需要對(duì)三部分進(jìn)行編碼：表示符號(hào)的s，及階碼E、尾數(shù)碼M。C++中的double類型三種編碼所占的位數(shù)如圖所示。

53位尾數(shù)碼所能達(dá)到的精度為53二進(jìn)制位，約為16 個(gè)十進(jìn)制位( 53 log10(2) ≈ 15.955) [1]，尾數(shù)碼的編碼中還有一個(gè)隱含的開(kāi)頭整數(shù)位1（或0，當(dāng)11位階碼全0時(shí)）因此實(shí)際中可得15-17位十進(jìn)制的精度。當(dāng)有效位數(shù)最多15位的十進(jìn)制數(shù)轉(zhuǎn)換成double然后重新轉(zhuǎn)換為原來(lái)的十進(jìn)制類型時(shí)，數(shù)值保持一致；另一方面，將一個(gè)double數(shù)轉(zhuǎn)化為可以容納17位以上有效數(shù)字的十進(jìn)制數(shù)再重新轉(zhuǎn)化為double，結(jié)果數(shù)值也保持一致。

這就解釋了為什么4字節(jié)的整數(shù)轉(zhuǎn)化為double重新轉(zhuǎn)化能保持一致（2^32=4294967296僅10個(gè)有效位），而8字節(jié)的整數(shù)卻可能丟失精度（2^64-1=18446744073709551615共20個(gè)有效位）。但第一個(gè)問(wèn)題中整數(shù)丟失精度后轉(zhuǎn)化成的double數(shù)值是怎么來(lái)的呢，這需要了解C++階碼和尾數(shù)對(duì)于double數(shù)值的意義。

2 階碼編碼和尾數(shù)編碼

在階碼編碼中，有一個(gè)常數(shù)偏置量Bias=1023，假設(shè)11位階碼所代表的無(wú)符號(hào)整數(shù)值為e，

1）若e不為0（11位全為1時(shí)用于表示特殊數(shù)字，此處不討論），則double數(shù)值為

2）若e=0，則小數(shù)值為

那么，可以看函數(shù)showEncodeOfDouble了，它的作用是將一個(gè)double數(shù)的編碼按字節(jié)打印出來(lái)（左邊是高字節(jié)），按其打印結(jié)果按照上面計(jì)算，可知double編碼值表示的數(shù)值是2^64，這是合理的，當(dāng)把精度較高的整數(shù)轉(zhuǎn)化為double時(shí)，C++采用向偶數(shù)舍入的方式得到最接近的值[2]。至于打印出的結(jié)果，屬于C++浮點(diǎn)數(shù)打印中的細(xì)節(jié)問(wèn)題。

3 C++浮點(diǎn)數(shù)打印

許多C/C++的庫(kù)中在輸出double時(shí)，通常有意使得輸出結(jié)果簡(jiǎn)短些（即使設(shè)置了足夠多的可見(jiàn)位數(shù)），以避免較大位數(shù)的輸出。直接使用C中的printf或cout打印double數(shù)時(shí)，打印顯示的結(jié)果也有可能是帶有精度丟失的結(jié)果，可使用16進(jìn)制的方式打印出更精確的double：

printf("%a\n",d1);

得到的輸出結(jié)果為：

0x1.000000p+64

至此問(wèn)題1實(shí)際上只是C++中，將高精度整數(shù)轉(zhuǎn)double時(shí)的偶數(shù)舍入問(wèn)題。

對(duì)于問(wèn)題2，從float或double轉(zhuǎn)換成int,值將會(huì)被向零舍入.例如1.999將被轉(zhuǎn)換成1而-1.999將會(huì)被轉(zhuǎn)換成-1。進(jìn)一步來(lái)說(shuō)，值有可能會(huì)溢出。C語(yǔ)言標(biāo)準(zhǔn)沒(méi)有對(duì)這種情況指出固定的結(jié)果，這種轉(zhuǎn)換行為是無(wú)定義的。

參考鏈接：

[1] http://en.wikipedia.org/wiki/Double-precision_floating-point_format#cite_note-whyieee-1

[2]深入理解計(jì)算機(jī)系統(tǒng)，Randal E. Bryant, 機(jī)械工業(yè)出版社

[3]http://stackoverflow.com/questions/4738768/printing-double-without-losing-precision

到此這篇關(guān)于C++中double浮點(diǎn)數(shù)精度丟失的深入分析的文章就介紹到這了,更多相關(guān)C++ double浮點(diǎn)數(shù)精度丟失內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: