欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

用C++實現(xiàn)DBSCAN聚類算法

 更新時間:2013年05月24日 16:45:52   作者:  
本篇文章是對使用C++實現(xiàn)DBSCAN聚類算法的方法進行了詳細的分析介紹,需要的朋友參考下
這幾天由于工作需要,對DBSCAN聚類算法進行了C++的實現(xiàn)。時間復(fù)雜度O(n^2),主要花在算每個點領(lǐng)域內(nèi)的點上。算法很簡單,現(xiàn)共享大家參考,也希望有更多交流。
 數(shù)據(jù)點類型描述如下:
復(fù)制代碼 代碼如下:

#include <vector>

 using namespace std;

 const int DIME_NUM=2;        //數(shù)據(jù)維度為2,全局常量

 //數(shù)據(jù)點類型
 class DataPoint
 {
 private:
     unsigned long dpID;                //數(shù)據(jù)點ID
     double dimension[DIME_NUM];        //維度數(shù)據(jù)
     long clusterId;                    //所屬聚類ID
     bool isKey;                        //是否核心對象
     bool visited;                    //是否已訪問
     vector<unsigned long> arrivalPoints;    //領(lǐng)域數(shù)據(jù)點id列表
 public:
     DataPoint();                                                    //默認構(gòu)造函數(shù)
     DataPoint(unsigned long dpID,double* dimension , bool isKey);    //構(gòu)造函數(shù)

     unsigned long GetDpId();                //GetDpId方法
     void SetDpId(unsigned long dpID);        //SetDpId方法
     double* GetDimension();                    //GetDimension方法
     void SetDimension(double* dimension);    //SetDimension方法
     bool IsKey();                            //GetIsKey方法
     void SetKey(bool isKey);                //SetKey方法
     bool isVisited();                        //GetIsVisited方法
     void SetVisited(bool visited);            //SetIsVisited方法
     long GetClusterId();                    //GetClusterId方法
     void SetClusterId(long classId);        //SetClusterId方法
     vector<unsigned long>& GetArrivalPoints();    //GetArrivalPoints方法
 };

這是實現(xiàn):
復(fù)制代碼 代碼如下:

#include "DataPoint.h"

 //默認構(gòu)造函數(shù)
 DataPoint::DataPoint()
 {
 }

 //構(gòu)造函數(shù)
 DataPoint::DataPoint(unsigned long dpID,double* dimension , bool isKey):isKey(isKey),dpID(dpID)
 {
     //傳遞每維的維度數(shù)據(jù)
     for(int i=0; i<DIME_NUM;i++)
     {
         this->dimension[i]=dimension[i];
     }
 }

 //設(shè)置維度數(shù)據(jù)
 void DataPoint::SetDimension(double* dimension)
 {
     for(int i=0; i<DIME_NUM;i++)
     {
         this->dimension[i]=dimension[i];
     }
 }

 //獲取維度數(shù)據(jù)
 double* DataPoint::GetDimension()
 {
     return this->dimension;
 }

 //獲取是否為核心對象
 bool DataPoint::IsKey()
 {
     return this->isKey;
 }

 //設(shè)置核心對象標志
 void DataPoint::SetKey(bool isKey)
 {
     this->isKey = isKey;
 }

 //獲取DpId方法
 unsigned long DataPoint::GetDpId()
 {
     return this->dpID;
 }

 //設(shè)置DpId方法
 void DataPoint::SetDpId(unsigned long dpID)
 {
     this->dpID = dpID;
 }

 //GetIsVisited方法
 bool DataPoint::isVisited()
 {
     return this->visited;
 }

 
 //SetIsVisited方法
 void DataPoint::SetVisited( bool visited )
 {
     this->visited = visited;
 }

 //GetClusterId方法
 long DataPoint::GetClusterId()
 {
     return this->clusterId;
 }

 //GetClusterId方法
 void DataPoint::SetClusterId( long clusterId )
 {
     this->clusterId = clusterId;
 }

 //GetArrivalPoints方法
 vector<unsigned long>& DataPoint::GetArrivalPoints()
 {
     return arrivalPoints;
 }

DBSCAN算法類型描述:
復(fù)制代碼 代碼如下:

#include <iostream>
 #include <cmath>

 using namespace std;

 //聚類分析類型
 class ClusterAnalysis
 {
 private:
     vector<DataPoint> dadaSets;        //數(shù)據(jù)集合
     unsigned int dimNum;            //維度
     double radius;                    //半徑
     unsigned int dataNum;            //數(shù)據(jù)數(shù)量
     unsigned int minPTs;            //鄰域最小數(shù)據(jù)個數(shù)

     double GetDistance(DataPoint& dp1, DataPoint& dp2);                    //距離函數(shù)
     void SetArrivalPoints(DataPoint& dp);                                //設(shè)置數(shù)據(jù)點的領(lǐng)域點列表
     void KeyPointCluster( unsigned long i, unsigned long clusterId );    //對數(shù)據(jù)點領(lǐng)域內(nèi)的點執(zhí)行聚類操作
 public:

     ClusterAnalysis(){}                    //默認構(gòu)造函數(shù)
     bool Init(char* fileName, double radius, int minPTs);    //初始化操作
     bool DoDBSCANRecursive();            //DBSCAN遞歸算法
     bool WriteToFile(char* fileName);    //將聚類結(jié)果寫入文件
 };

 聚類實現(xiàn):
復(fù)制代碼 代碼如下:

#include "ClusterAnalysis.h"
 #include <fstream>
 #include <iosfwd>
 #include <math.h>

 /*
 函數(shù):聚類初始化操作
 說明:將數(shù)據(jù)文件名,半徑,領(lǐng)域最小數(shù)據(jù)個數(shù)信息寫入聚類算法類,讀取文件,把數(shù)據(jù)信息讀入寫進算法類數(shù)據(jù)集合中
 參數(shù):
 char* fileName;    //文件名
 double radius;    //半徑
 int minPTs;        //領(lǐng)域最小數(shù)據(jù)個數(shù) 
 返回值: true;    */
 bool ClusterAnalysis::Init(char* fileName, double radius, int minPTs)
 {
     this->radius = radius;        //設(shè)置半徑
     this->minPTs = minPTs;        //設(shè)置領(lǐng)域最小數(shù)據(jù)個數(shù)
     this->dimNum = DIME_NUM;    //設(shè)置數(shù)據(jù)維度
     ifstream ifs(fileName);        //打開文件
     if (! ifs.is_open())                //若文件已經(jīng)被打開,報錯誤信息
     {
         cout << "Error opening file";    //輸出錯誤信息
         exit (-1);                        //程序退出
     }

     unsigned long i=0;            //數(shù)據(jù)個數(shù)統(tǒng)計
     while (! ifs.eof() )                //從文件中讀取POI信息,將POI信息寫入POI列表中
     {
         DataPoint tempDP;                //臨時數(shù)據(jù)點對象
         double tempDimData[DIME_NUM];    //臨時數(shù)據(jù)點維度信息
         for(int j=0; j<DIME_NUM; j++)    //讀文件,讀取每一維數(shù)據(jù)
         {
             ifs>>tempDimData[j];
         }
         tempDP.SetDimension(tempDimData);    //將維度信息存入數(shù)據(jù)點對象內(nèi)

 //char date[20]="";
 //char time[20]="";
         ////double type;    //無用信息
         //ifs >> date;
 //ifs >> time;    //無用信息讀入

         tempDP.SetDpId(i);                    //將數(shù)據(jù)點對象ID設(shè)置為i
         tempDP.SetVisited(false);            //數(shù)據(jù)點對象isVisited設(shè)置為false
         tempDP.SetClusterId(-1);            //設(shè)置默認簇ID為-1
         dadaSets.push_back(tempDP);            //將對象壓入數(shù)據(jù)集合容器
         i++;        //計數(shù)+1
     }
     ifs.close();        //關(guān)閉文件流
     dataNum =i;            //設(shè)置數(shù)據(jù)對象集合大小為i
     for(unsigned long i=0; i<dataNum;i++)
     {
         SetArrivalPoints(dadaSets[i]);            //計算數(shù)據(jù)點領(lǐng)域內(nèi)對象
     }
     return true;    //返回
 }

 /*
 函數(shù):將已經(jīng)過聚類算法處理的數(shù)據(jù)集合寫回文件
 說明:將已經(jīng)過聚類結(jié)果寫回文件
 參數(shù):
 char* fileName;    //要寫入的文件名
 返回值: true    */
 bool ClusterAnalysis::WriteToFile(char* fileName )
 {
     ofstream of1(fileName);                                //初始化文件輸出流
     for(unsigned long i=0; i<dataNum;i++)                //對處理過的每個數(shù)據(jù)點寫入文件
     {
         for(int d=0; d<DIME_NUM ; d++)                    //將維度信息寫入文件
             of1<<dadaSets[i].GetDimension()[d]<<'\t';
         of1 << dadaSets[i].GetClusterId() <<endl;        //將所屬簇ID寫入文件
     }
     of1.close();    //關(guān)閉輸出文件流
     return true;    //返回
 }

 /*
 函數(shù):設(shè)置數(shù)據(jù)點的領(lǐng)域點列表
 說明:設(shè)置數(shù)據(jù)點的領(lǐng)域點列表
 參數(shù):
 返回值: true;    */
 void ClusterAnalysis::SetArrivalPoints(DataPoint& dp)
 {
     for(unsigned long i=0; i<dataNum; i++)                //對每個數(shù)據(jù)點執(zhí)行
     {
         double distance =GetDistance(dadaSets[i], dp);    //獲取與特定點之間的距離
         if(distance <= radius && i!=dp.GetDpId())        //若距離小于半徑,并且特定點的id與dp的id不同執(zhí)行
             dp.GetArrivalPoints().push_back(i);            //將特定點id壓力dp的領(lǐng)域列表中
     }
     if(dp.GetArrivalPoints().size() >= minPTs)            //若dp領(lǐng)域內(nèi)數(shù)據(jù)點數(shù)據(jù)量> minPTs執(zhí)行
     {
         dp.SetKey(true);    //將dp核心對象標志位設(shè)為true
         return;                //返回
     }
     dp.SetKey(false);    //若非核心對象,則將dp核心對象標志位設(shè)為false
 }

 
 /*
 函數(shù):執(zhí)行聚類操作
 說明:執(zhí)行聚類操作
 參數(shù):
 返回值: true;    */
 bool ClusterAnalysis::DoDBSCANRecursive()
 {
     unsigned long clusterId=0;                        //聚類id計數(shù),初始化為0
     for(unsigned long i=0; i<dataNum;i++)            //對每一個數(shù)據(jù)點執(zhí)行
     {
         DataPoint& dp=dadaSets[i];                    //取到第i個數(shù)據(jù)點對象
         if(!dp.isVisited() && dp.IsKey())            //若對象沒被訪問過,并且是核心對象執(zhí)行
         {
             dp.SetClusterId(clusterId);                //設(shè)置該對象所屬簇ID為clusterId
             dp.SetVisited(true);                    //設(shè)置該對象已被訪問過
             KeyPointCluster(i,clusterId);            //對該對象領(lǐng)域內(nèi)點進行聚類
             clusterId++;                            //clusterId自增1
         }
         //cout << "孤立點\T" << i << endl;
     }

     cout <<"共聚類" <<clusterId<<"個"<< endl;        //算法完成后,輸出聚類個數(shù)
     return true;    //返回
 }

 /*
 函數(shù):對數(shù)據(jù)點領(lǐng)域內(nèi)的點執(zhí)行聚類操作
 說明:采用遞歸的方法,深度優(yōu)先聚類數(shù)據(jù)
 參數(shù):
 unsigned long dpID;            //數(shù)據(jù)點id
 unsigned long clusterId;    //數(shù)據(jù)點所屬簇id
 返回值: void;    */
 void ClusterAnalysis::KeyPointCluster(unsigned long dpID, unsigned long clusterId )
 {
     DataPoint& srcDp = dadaSets[dpID];        //獲取數(shù)據(jù)點對象
     if(!srcDp.IsKey())    return;
     vector<unsigned long>& arrvalPoints = srcDp.GetArrivalPoints();        //獲取對象領(lǐng)域內(nèi)點ID列表
     for(unsigned long i=0; i<arrvalPoints.size(); i++)
     {
         DataPoint& desDp = dadaSets[arrvalPoints[i]];    //獲取領(lǐng)域內(nèi)點數(shù)據(jù)點
         if(!desDp.isVisited())                            //若該對象沒有被訪問過執(zhí)行
         {
             //cout << "數(shù)據(jù)點\t"<< desDp.GetDpId()<<"聚類ID為\t" <<clusterId << endl;
             desDp.SetClusterId(clusterId);        //設(shè)置該對象所屬簇的ID為clusterId,即將該對象吸入簇中
             desDp.SetVisited(true);                //設(shè)置該對象已被訪問
             if(desDp.IsKey())                    //若該對象是核心對象
             {
                 KeyPointCluster(desDp.GetDpId(),clusterId);    //遞歸地對該領(lǐng)域點數(shù)據(jù)的領(lǐng)域內(nèi)的點執(zhí)行聚類操作,采用深度優(yōu)先方法
             }
         }
     }
 }

 //兩數(shù)據(jù)點之間距離
 /*
 函數(shù):獲取兩數(shù)據(jù)點之間距離
 說明:獲取兩數(shù)據(jù)點之間的歐式距離
 參數(shù):
 DataPoint& dp1;        //數(shù)據(jù)點1
 DataPoint& dp2;        //數(shù)據(jù)點2
 返回值: double;    //兩點之間的距離        */
 double ClusterAnalysis::GetDistance(DataPoint& dp1, DataPoint& dp2)
 {
     double distance =0;        //初始化距離為0
     for(int i=0; i<DIME_NUM;i++)    //對數(shù)據(jù)每一維數(shù)據(jù)執(zhí)行
     {
         distance += pow(dp1.GetDimension()[i] - dp2.GetDimension()[i],2);    //距離+每一維差的平方
     }
     return pow(distance,0.5);        //開方并返回距離
 }

算法調(diào)用就簡單了:
復(fù)制代碼 代碼如下:

#include "ClusterAnalysis.h"
 #include <cstdio>

 using namespace std;

 int main()
 {
     ClusterAnalysis myClusterAnalysis;                        //聚類算法對象聲明
     myClusterAnalysis.Init("D:\\1108\\XY.txt",500,9);        //算法初始化操作,指定半徑為15,領(lǐng)域內(nèi)最小數(shù)據(jù)點個數(shù)為3,(在程序中已指定數(shù)據(jù)維度為2)
     myClusterAnalysis.DoDBSCANRecursive();                    //執(zhí)行聚類算法
     myClusterAnalysis.WriteToFile("D:\\1108\\XYResult.txt");//寫執(zhí)行后的結(jié)果寫入文件

     system("pause");    //顯示結(jié)果
     return 0;            //返回
 }

相關(guān)文章

  • C++利用用埃式篩法求解素數(shù)

    C++利用用埃式篩法求解素數(shù)

    埃拉托斯特尼篩法,簡稱埃氏篩或愛氏篩,是一種由希臘數(shù)學(xué)家埃拉托斯特尼所提出的一種簡單檢定素數(shù)的算法。本文將利用這一算法實現(xiàn)求解素數(shù),感興趣的可以了解一下
    2023-01-01
  • C++的optional用法實例詳解

    C++的optional用法實例詳解

    編程中我們可能會遇到要處理可能為空的變量,比如說容器,基本類型,或者說對象實例,下面通過實例代碼介紹C++的optional用法,感興趣的朋友一起看看吧
    2024-02-02
  • VC++開發(fā)中完美解決頭文件相互包含問題的方法解析

    VC++開發(fā)中完美解決頭文件相互包含問題的方法解析

    本文中,為了敘述方便,把class AClass;語句成為類AClass的聲明,把class AClass開始的對AClass的類成員變量、成員函數(shù)原型等的說明稱為類的定義,而把在CPP中的部分稱為類的定義
    2013-09-09
  • C++面試題之?dāng)?shù)a、b的值互換(不使用中間變量)

    C++面試題之?dāng)?shù)a、b的值互換(不使用中間變量)

    這篇文章主要介紹了不使用中間變量,C++實現(xiàn)數(shù)a、b的值互相轉(zhuǎn)換操作,感興趣的小伙伴們可以參考一下
    2016-07-07
  • C 語言進制之間的轉(zhuǎn)換

    C 語言進制之間的轉(zhuǎn)換

    本篇文章主要介紹了C語言進制之間的轉(zhuǎn)換,舉例說明并附圖片,幫助大家理解,希望對大家有所幫助
    2016-07-07
  • 基于QT設(shè)計一個春聯(lián)自動生成器

    基于QT設(shè)計一個春聯(lián)自動生成器

    春節(jié)是中國最隆重的傳統(tǒng)節(jié)日,一到過年家家戶戶肯定是要貼春聯(lián);在春節(jié)前夕,會用大紅紙張,加上濃墨書寫祝福詞語。本文將利用Qt框架設(shè)計一個春聯(lián)自動生成器,需要的可以參考一下
    2022-01-01
  • 深入講解C++數(shù)據(jù)類型轉(zhuǎn)換的相關(guān)函數(shù)的知識

    深入講解C++數(shù)據(jù)類型轉(zhuǎn)換的相關(guān)函數(shù)的知識

    這篇文章主要介紹了深入講解C++數(shù)據(jù)類型轉(zhuǎn)換的相關(guān)函數(shù)的知識,包括類型轉(zhuǎn)換運算符函數(shù)等內(nèi)容,需要的朋友可以參考下
    2015-09-09
  • C++?QT實現(xiàn)獲取本機網(wǎng)卡信息

    C++?QT實現(xiàn)獲取本機網(wǎng)卡信息

    這篇文章主要為大家詳細介紹了如何利用qt自帶的QNetworkInterface接口以及c++Iphlpapi庫,獲取當(dāng)前windows電腦下的網(wǎng)卡信息,需要的可以參考下
    2024-01-01
  • C++實例分析講解臨時對象與右值引用的用法

    C++實例分析講解臨時對象與右值引用的用法

    對性能來說,許多的問題都需要和出現(xiàn)頻率及本身執(zhí)行一次的開銷掛鉤,有些問題雖然看似比較開銷較大,但是很少會執(zhí)行到,那也不會對程序有大的影響;同樣一個很小開銷的函數(shù)執(zhí)行很頻繁,同樣會對程序的執(zhí)行效率有很大影響。本章中作者主要根據(jù)臨時對象來闡述這樣一個觀點
    2022-08-08
  • C++類的繼承和派生及指針安全引用

    C++類的繼承和派生及指針安全引用

    這篇文章主要介紹了C++類的繼承和派生及指針安全引用,繼承指從現(xiàn)有類獲得其特性,派生指從已有類產(chǎn)生新的類,指針和引用并存,二者似乎有很多相同點,但是又不完全相同,下面關(guān)于兩者的相關(guān)資料,需要的小伙伴可以參考一下
    2022-03-03

最新評論