Linux 本編輯器vim顯示utf-8文檔亂碼的解決方法

在Linux系統(tǒng)操作中,Vim是文本編輯器,在使用Vim的時候,居然顯示utf-8文檔亂碼,遇到這種情況要如何解決呢?下面小編就給大家介紹下Linux如何解決Vim顯示utf-8文檔亂碼問題,一起來看看吧。
1.相關(guān)基礎(chǔ)知識介紹
在Vim中,有四個與編碼有關(guān)的選項,它們是:fileencodings、fileencoding、encoding和termencoding。在實際使用中,任何一個選項出現(xiàn)錯誤,都會導(dǎo)致出現(xiàn)亂碼。因此,每一個Vim用戶都應(yīng)該明確這四個選項的含義。下面,我們詳細(xì)介紹一下這四個選項的含義和作用。
?。?)encoding
encoding是Vim內(nèi)部使用的字符編碼方式。當(dāng)我們設(shè)置了encoding之后,Vim內(nèi)部所有的buffer、寄存器、腳本中的字符串等,全都使用這個編碼。Vim 在工作的時候,如果編碼方式與它的內(nèi)部編碼不一致,它會先把編碼轉(zhuǎn)換成內(nèi)部編碼。如果工作用的編碼中含有無法轉(zhuǎn)換為內(nèi)部編碼的字符,在這些字符就會丟失。因此,在選擇 Vim 的內(nèi)部編碼的時候,一定要使用一種表現(xiàn)能力足夠強(qiáng)的編碼,以免影響正常工作。
由于encoding選項涉及到Vim中所有字符的內(nèi)部表示,因此只能在Vim啟動的時候設(shè)置一次。在Vim工作過程中修改encoding會造成非常多的問題。用戶手冊上建議只在 .vimrc中改變它的值,事實上似乎也只有在 .vimrc中改變它的值才有意義。如果沒有特別的理由,請始終將encoding設(shè)置為utf-8。為了避免在非UTF-8的系統(tǒng)如Windows下,菜單和系統(tǒng)提示出現(xiàn)亂碼,可同時做這幾項設(shè)置:
set encoding=utf-8
set langmenu=zh_CN.UTF-8
language message zh_CN.UTF-8
(2)termencoding
termencoding是Vim用于屏幕顯示的編碼,在顯示的時候,Vim會把內(nèi)部編碼轉(zhuǎn)換為屏幕編碼,再用于輸出。內(nèi)部編碼中含有無法轉(zhuǎn)換為屏幕編碼的字符時,該字符會變成問號,但不會影響對它的編輯操作。如果termencoding沒有設(shè)置,則直接使用encoding不進(jìn)行轉(zhuǎn)換。
舉個例子,當(dāng)你在Windows下通過telnet登錄Linux工作站時,由于Windows的telnet是GBK編碼的,而Linux下使用UTF-8編碼,你在telnet下的Vim中就會亂碼。此時有兩種消除亂碼的方式:一是把Vim的encoding改為gbk,另一種方法是保持encoding為utf-8,把termencoding改為gbk,讓Vim在顯示的時候轉(zhuǎn)碼。顯然,使用前一種方法時,如果遇到編輯的文件中含有GBK無法表示的字符時,這些字符就會丟失。但如果使用后一種方法,雖然由于終端所限,這些字符無法顯示,但在編輯過程中這些字符是不會丟失的。
對于圖形界面下的GVim,它的顯示不依賴TERM,因此termencoding對于它沒有意義。在GTK2下的GVim 中,termencoding永遠(yuǎn)是utf-8,并且不能修改。而Windows下的GVim則忽略termencoding的存在。
?。?)fileencoding
當(dāng)Vim從磁盤上讀取文件的時候,會對文件的編碼進(jìn)行探測。如果文件的編碼方式和Vim的內(nèi)部編碼方式不同,Vim就會對編碼進(jìn)行轉(zhuǎn)換。轉(zhuǎn)換完畢后,Vim會將fileencoding選項設(shè)置為文件的編碼。當(dāng)Vim存盤的時候,如果encoding和fileencoding不一樣,Vim就會進(jìn)行編碼轉(zhuǎn)換。因此,通過打開文件后設(shè)置fileencoding,我們可以將文件由一種編碼轉(zhuǎn)換為另一種編碼。但是,由前面的介紹可以看出,fileencoding是在打開文件的時候,由Vim進(jìn)行探測后自動設(shè)置的。因此,如果出現(xiàn)亂碼,我們無法通過在打開文件后重新設(shè)置fileencoding來糾正亂碼。
簡而言之,fileencoding是Vim中當(dāng)前編輯的文件的字符編碼方式,Vim保存文件時也會將文件保存為這種字符編碼方式 (不管是否新文件都如此)。
?。?)fileencodings
編碼的自動識別是通過設(shè)置fileencodings實現(xiàn)的,注意是復(fù)數(shù)形式。fileencodings是一個用逗號分隔的列表,列表中的每一項是一種編碼的名稱。當(dāng)我們打開文件的時候,VIM按順序使用fileencodings中的編碼進(jìn)行嘗試解碼,如果成功的話,就使用該編碼方式進(jìn)行解碼,并將fileencoding設(shè)置為這個值,如果失敗的話,就繼續(xù)試驗下一個編碼。
因此,我們在設(shè)置fileencodings的時候,一定要把要求嚴(yán)格的、當(dāng)文件不是這個編碼的時候更容易出現(xiàn)解碼失敗的編碼方式放在前面,把寬松的編碼方式放在后面。例如,latin1是一種非常寬松的編碼方式,任何一種編碼方式得到的文本,用latin1進(jìn)行解碼,都不會發(fā)生解碼失敗——當(dāng)然,解碼得到的結(jié)果自然也就是理所當(dāng)然的“亂碼”。因此,如果你把latin1放到了fileencodings的第一位的話,打開任何中文文件都是亂碼也就是理所當(dāng)然的了。
以下是網(wǎng)上推薦的一個fileencodings設(shè)置:
set fileencodings=ucs-bom,utf-8,cp936,gb18030,big5,euc-jp,euc-kr,latin1
其中,ucs-bom是一種非常嚴(yán)格的編碼,非該編碼的文件幾乎沒有可能被誤判為ucs-bom,因此放在第一位。
utf-8也相當(dāng)嚴(yán)格,除了很短的文件外(例如許多人津津樂道的GBK編碼的“聯(lián)通”被誤判為UTF-8編碼的經(jīng)典錯誤),現(xiàn)實生活中一般文件是幾乎不可能被誤判的,因此放在第二位。
接下來是cp936和gb18030,這兩種編碼相對寬松,如果放前面的話,會出現(xiàn)大量誤判,所以就讓它們靠后一些。cp936的編碼空間比gb18030小,所以把cp936放在gb18030前面。
至于big5、euc-jp和euc-kr,它們的嚴(yán)格程度和cp936差不多,把它們放在后面,在編輯這些編碼的文件的時候必然出現(xiàn)大量誤判,但這是Vim內(nèi)置編碼探測機(jī)制沒有辦法解決的事。由于中國用戶很少有機(jī)會編輯這些編碼的文件,因此我們還是決定把cp936和gb18030放在前面以保證這些編碼的識別。
最后就是latin1了。它是一種極其寬松的編碼,以至于我們不得不把它放在最后一位。不過可惜的是,當(dāng)你碰到一個真的latin1編碼的文件時,絕大部分情況下,它沒有機(jī)會fall-back到latin1,往往在前面的編碼中就被誤判了。不過,正如前面所說的,中國用戶沒有太多機(jī)會接觸這樣的文件。
如果編碼被誤判了,解碼后的結(jié)果就無法被人類識別,于是我們就說,這個文件亂碼了。此時,如果你知道這個文件的正確編碼的話,可以在打開文件的時候使用 ++enc=encoding 的方式來打開文件,如:
?。篹 ++enc=utf-8 myfile.txt
上面就是Linux解決Vim顯示utf-8文檔亂碼的方法介紹了,出現(xiàn)該亂碼問題后,可通過重新設(shè)置fileencodings來解決,希望對你有所幫助。
相關(guān)文章
Fedora Linux 42 穩(wěn)定版發(fā)布: 帶來大量新功能和軟件更新
Fedora 42昨日發(fā)布,這是 Red Hat 贊助開發(fā)的杰出前沿 Linux 發(fā)行版的最新版,包含大量新功能和軟件更新,使其成為 2025 年上半年發(fā)布的一款出色的 Linux 操作系統(tǒng)之一,內(nèi)2025-04-16如何在Linux查看硬盤信息? 查看Linux硬盤大小類型和硬件信息的5種方法
使用Linux系統(tǒng)的過程中,查看和了解硬盤信息是非常重要的工作,尤其是對于系統(tǒng)管理員而言,那么在Linux系統(tǒng)中如何查看硬盤信息?以下是具體內(nèi)容介紹2025-03-12如何在 Linux 中查看 CPU 詳細(xì)信息? 3招輕松查看CPU型號、核心數(shù)和溫度
在日常運維工作中,獲取 CPU 信息是系統(tǒng)運維管理員常見的工作內(nèi)容,無論是為了性能調(diào)優(yōu)、硬件升級還是僅僅滿足好奇心2025-03-11什么是 Arch Linux? 獨樹一幟的Arch Linux發(fā)行版分析
Arch Linux是為簡化,優(yōu)化,現(xiàn)代化,實用主義,用戶中心和多功能性而創(chuàng)建Linux發(fā)行版,究竟是什么讓 Arch 與眾不同?下面我們就來簡要解讀2025-02-19如何在Linux環(huán)境下制作 Win11裝機(jī)U盤?
一直用的linux辦公,想要將筆記本電腦從 Linux 系統(tǒng)切換回 Windows 11,我們可以制作一個win11裝機(jī)u盤,詳細(xì)如下2025-02-17Rsnapshot怎么用? 基于Rsync的強(qiáng)大Linux備份工具使用指南
Rsnapshot 不僅可以備份本地文件,還能通過 SSH 備份遠(yuǎn)程文件,接下來詳細(xì)介紹如何安裝、配置和使用 Rsnapshot,包括創(chuàng)建每小時、每天、每周和每月的本地備份,以及如何進(jìn)2025-02-06Linux Kernel 6.13發(fā)布:附更新內(nèi)容及新特性解讀
Linux 內(nèi)核 6.13 正式發(fā)布,新版本引入了惰性搶占支持,簡化內(nèi)核搶占邏輯,通過減少與調(diào)度器相關(guān)的調(diào)用次數(shù),讓內(nèi)核在運行時表現(xiàn)更優(yōu),從而提高效率2025-01-23五大特性引領(lǐng)創(chuàng)新! 深度操作系統(tǒng) deepin 25 Preview預(yù)覽版發(fā)布
今日,深度操作系統(tǒng)正式推出deepin 25 Preview版本,該版本集成了五大核心特性:磐石系統(tǒng)、全新DDE、Treeland窗口合成器、AI For OS以及Distrobox子系統(tǒng)2025-01-18Linux Mint Xia 22.1重磅發(fā)布: 重要更新一覽
Beta 版 Linux Mint“Xia” 22.1 發(fā)布,新版本基于 Ubuntu 24.04,內(nèi)核版本為 Linux 6.8,這次更新帶來了諸多優(yōu)化和改進(jìn),進(jìn)一步鞏固了 Mint 在 Linux 桌面操作系統(tǒng)領(lǐng)域的2025-01-16LinuxMint怎么安裝? Linux Mint22下載安裝圖文教程
Linux Mint22發(fā)布以后,有很多新功能,很多朋友想要下載并安裝,該怎么操作呢?下面我們就來看看詳細(xì)安裝指南2025-01-16