Perl中著名的Schwartzian轉(zhuǎn)換問(wèn)題解決實(shí)現(xiàn)
Perl中著名的Schwartzian轉(zhuǎn)換,其產(chǎn)生背景主要涉及到排序問(wèn)題:
比如說(shuō),根據(jù)文件名以字母順序排序,代碼如下:
use strict;
use warnings;
my @files = glob "*.xml"; #perl中文件操作符glob提供相當(dāng)于shell中的通配符的功能
my @sorted_files = sort @files; #sort(),排序,默認(rèn)是字母順序排序
比如說(shuō),根據(jù)文件名長(zhǎng)度排序,其代碼如下:
use strict;
use warnings;
#length求長(zhǎng)度。 太空船操作符<=>,默認(rèn)變量是$a,$b,返回值為-1,0,1分別表示大于,==,小于。 sort進(jìn)行排序
my $files = ".xml";
my @sorted_length = sort { length($a) <=> length($b) } @files;
上面的兩種情況,對(duì)很多文件操作來(lái)說(shuō),速度還不算慢,如果是下面這種情況。
比如說(shuō):要批量比較文件大小,其代碼如下:
use strict;
use warnings;
my @files = glob "*.xml";
my @sort_size = sort { -s $a <=> -s $b } @files; #比較大小
上面的代碼設(shè)計(jì)到三重(次)操作:
1. 從硬盤上獲取文件大小(-s $b)
2. 比較文件大小(太空船操作)
3. 對(duì)其進(jìn)行排序(sort操作)
考慮到要比較$a,$b大小時(shí),要從硬盤中獲取兩次,所以次數(shù)是6次!也就是說(shuō),如果有1萬(wàn)個(gè)文件,總共是6萬(wàn)次。
其算法復(fù)雜度是: n*long(n),考慮到后兩項(xiàng)(比較文件大小,進(jìn)行排序)必然要進(jìn)行的操作,但第一項(xiàng)卻可以降低!
即一次性從硬盤中讀取所有文件大小,將其放置到Perl中的默認(rèn)的變量,并存儲(chǔ)到內(nèi)存中!于是又下面算法實(shí)現(xiàn):
use strict;
use warnings;
my @files = glob "*.xml";
my @unsorted_pairs = map { [$_, -s $_] } @files;
my @sorted_pairs = sort { $a->[1] <=> $b->[1] } @unsorted_pairs;
my @sorted_files = map { $_->[0] } @sorted_pairs;
看上去比較復(fù)雜,分三個(gè)步驟解釋下:
第一步:遍歷文件列表,對(duì)每個(gè)文件創(chuàng)建一個(gè)數(shù)組引用。數(shù)組引用包含兩個(gè)元素:
第一個(gè)是文件名($_),第二個(gè)是文件大小(-s $_)。這樣,處理每個(gè)文件只訪問(wèn)一次磁盤。
第二步:對(duì)二維數(shù)組排序。因比較文件大小,所以需取元素[1],比較它們的值。得到另一個(gè)二維數(shù)組。
第三步:丟掉文件大小元素,創(chuàng)建一個(gè)只含文件名的列表。完成目標(biāo)!
上面的代碼使用了兩個(gè)臨時(shí)數(shù)組,但這并不是必須的。我們可以一個(gè)語(yǔ)句就能完成所有的工作。為了達(dá)到目的,需要按照“數(shù)據(jù)從右流向左”的原理反轉(zhuǎn)句子順序,不如果將每個(gè)句子放在單獨(dú)一行,并且留出足夠的空間,我們依然可以寫出可讀性高的代碼。
my @quickly_sorted_files =
map { $_->[0] }
sort { $a->[1] <=> $b->[1] }
map { [$_, -s $_] }
@files;
這就是以Randal L. Schwartz命名的Schwartzian轉(zhuǎn)換,對(duì)數(shù)據(jù)量特多的情況下,其速度要比前者快數(shù)倍!
下面寫了小程序,包括在生成1萬(wàn)個(gè)xml文件,在兩種情況下,完整代碼如下:
#!/usr/bin/perl -w
use strict;
use warnings;
use autodie;
use v5.10;
######################################
### 創(chuàng)建要比較的10,000個(gè).xml文件 ###
######################################
my $profix = ".xml";
foreach my $num (1..10000) {
open(my $fh, '>', $num . $profix) || die "Can not create the file: $!\n";
print $fh "This is file size testing!";
}
print "All the 10_1000 files created! \n";
######################################
### 常規(guī)轉(zhuǎn)換: 遍歷20次 ###
######################################
my $t1 = time();
foreach (1..20){
my @files = glob "*.xml";
my @sorted = sort { -s $a <=> -s $b } @files;
}
say "常規(guī)算法需要時(shí)間: => ", time()- $t1;
######################################
### Schwartzian轉(zhuǎn)換: 遍歷20次 ###
######################################
my $t2 = time();
foreach (1..20){
my @files = glob "*.xml";
my @sorted =
map {$_->[0]}
sort {$a->[1] <=> $b->[1]}
map {[$_, -s $_]}
@files;
}
say "Schwartzian算法需要時(shí)間: => ", time()- $t2;
輸出結(jié)果:
All the 10_1000 files created!
常規(guī)算法需要時(shí)間: => 185
Schwartzian算法需要時(shí)間: => 115
相關(guān)文章
PyQt+socket實(shí)現(xiàn)遠(yuǎn)程操作服務(wù)器的方法示例
這篇文章主要介紹了PyQt+socket實(shí)現(xiàn)遠(yuǎn)程操作服務(wù)器的方法示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08Qt通過(guò)QGraphicsview實(shí)現(xiàn)簡(jiǎn)單縮放及還原效果
本文主要介紹通過(guò)QGraphicsview實(shí)現(xiàn)簡(jiǎn)單的縮放以及縮放后還原原始大小,通過(guò)scale可以對(duì)view進(jìn)行放大或縮小,具體內(nèi)容詳情跟隨小編一起看看吧2021-09-09Qt6中重大改變的QtMultimedia多媒體模塊實(shí)現(xiàn)
本文主要介紹了Qt6中重大改變的QtMultimedia多媒體模塊實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09Python自動(dòng)登錄QQ的實(shí)現(xiàn)示例
這篇文章主要介紹了Python自動(dòng)登錄QQ的實(shí)現(xiàn)示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08Python實(shí)現(xiàn)的北京積分落戶數(shù)據(jù)分析示例
這篇文章主要介紹了Python實(shí)現(xiàn)的北京積分落戶數(shù)據(jù)分析,結(jié)合實(shí)例形式分析了Python針對(duì)北京積分落戶數(shù)據(jù)的分析、運(yùn)算、展示等相關(guān)操作技巧,需要的朋友可以參考下2020-03-03Django動(dòng)態(tài)隨機(jī)生成溫度前端實(shí)時(shí)動(dòng)態(tài)展示源碼示例
本篇文章主要描述的是在動(dòng)態(tài)隨機(jī)生成溫度,在前端動(dòng)態(tài)實(shí)時(shí)展示,主要用到兩個(gè)東西,一個(gè)是APScheduler定時(shí)任務(wù) 和websocket,最后利用echarts將數(shù)據(jù)展示出來(lái),下面對(duì)這兩個(gè)分別進(jìn)行詳細(xì)的解說(shuō)2021-09-09python中的位置參數(shù)和關(guān)鍵字參數(shù)詳解
位置參數(shù)和關(guān)鍵字參數(shù)是 Python 中的兩種不同類型的函數(shù)參數(shù)傳遞方式,位置參數(shù)依賴于參數(shù)的位置順序,而關(guān)鍵字參數(shù)通過(guò)參數(shù)名傳遞,不受位置影響,本文通過(guò)代碼示例給大家詳細(xì)介紹了python中的位置參數(shù)和關(guān)鍵字參數(shù),需要的朋友可以參考下2023-12-12Python機(jī)器學(xué)習(xí)入門(五)之Python算法審查
這篇文章主要介紹了Python機(jī)器學(xué)習(xí)入門知識(shí),本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-08-08