docker.service啟動失?。篣nit not found的原因及解決辦法
背景
因為最近一直在折騰Kubernetes集群版本升級、Docker版本升級,所以不停的把測試環(huán)境安裝、還原、升級、降級,簡直亂的不行。終于,在測試Docker版本升級后,啟動Docker時,遇到了docker.service: Unit not found。問題雖然不大,但是卻折磨了我?guī)讉€小時,所以在此mark一下。
操作系統(tǒng):Red Hat Enterprise Linux 7
原因1:docker.socket
最初在啟動docker時遇到問題,是因為docker.socket引起的,雖然記不清問題是表現(xiàn)為Unit not found還是執(zhí)行systemctl start docker.service命令時hang住了,但是也一并記錄在這里。
問題描述
我是從Docker 1.10.3升級到1.13.1版本,通過rpm包安裝的。由于要保留自定義的一些Docker配置,所以在升級后,使用原來的/usr/lib/systemd/system/docker.service覆蓋了新的docker.service。但是在1.10.3版本中,docker.service的[UNIT]里規(guī)定了Requires=docker.socket,也就是說,docker.service默認(rèn)依賴于docker.socket,因為需要使用docker.socket來獲取容器的信息。
[Unit] Description=Docker Application Container Engine Documentation=https://docs.docker.com After=network.target docker.socket Requires=docker.socket
但是在1.13.1版本中,已經(jīng)不再依賴于docker.socket了,所以系統(tǒng)里沒有docker.socket,而我繼續(xù)使用原來的docker.service,所以在啟動的時候,就會出錯。
解決辦法
刪除/usr/lib/systemd/system/docker.service的[UNIT]里包含的docker.socket,然后systemctl daemon-reload,最后systemctl start docker.service,發(fā)現(xiàn)啟動成功了。
類似情況
如果是類似的情況,缺少docker.socket,但是新版本需要docker.socket。有兩種方法可以解決該問題:
- 可以卸載docker,再重新安裝,即可出現(xiàn)docker.socket?;蛘?/li>
- 創(chuàng)建一個/usr/lib/systemd/system/docker.socket文件,然后systemctl daemon-reload,最后systemctl start docker.service,即可啟動成功。
/usr/lib/systemd/system/docker.socket文件如下:
[Unit] Description=Docker Socket for the API PartOf=docker.service [Socket] ListenStream=/var/run/docker.sock SocketMode=0660 SocketUser=root SocketGroup=docker [Install] WantedBy=sockets.target
原因2:flanneld.service
就如背景里描述的,我恰好在這臺出問題的機(jī)器上,安裝過Kubernetes,以及flannel,然后又刪掉了我之前以為的“所有”相關(guān)的文件。正是由于flannel的文件沒有刪除干凈,導(dǎo)致出現(xiàn)了docker.service: Unit not found的問題。
問題描述
在確定不是因為docker.socket的問題導(dǎo)致的之后,我第一反應(yīng)就是刪除flannel導(dǎo)致的,因為我了解flanneld.service與docker.service直接是有啟動順序的關(guān)聯(lián)的:
[Unit] Description=Flanneld overlay address etcd agent After=network.target After=network-online.target Wants=network-online.target After=etcd.service Before=docker.service
真正困擾了我很久的是,/usr/lib/systemd/system/flanneld.service我已經(jīng)刪除了,也systemctl daemon-reload了,究竟還有哪個文件漏刪了。
經(jīng)過檢查,/etc/systemd/system/flanneld.service依然存在,并且存在/etc/systemd/system/docker.service.requires目錄,在該目錄下包含了軟連接flanneld.service,該軟鏈接指向了真正的flanneld.service,從而實現(xiàn)了兩個服務(wù)的啟動順序的關(guān)聯(lián)。
定位該類問題,經(jīng)常會用到的命令有:
- systemctl list-unit-files 列出所有可用的Unit
- systemctl list-units 列出所有正在運(yùn)行的Unit
- systemctl --failed 列出所有失敗單元
- systemctl mask httpd.service 禁用服務(wù)
- systemctl unmask httpd.service
- systemctl kill httpd 殺死服務(wù)
- systemd-analyze critical-chain:分析啟動時的關(guān)鍵鏈
- systemd-analyze blame 分析啟動時各個進(jìn)程花費的時間
解決辦法
使用systemctl unmask flanneld.service禁止flanneld服務(wù),然后刪除
/etc/systemd/system/docker.service.requires/flanneld.service,使用systemctl daemon-reload重新加載服務(wù)配置文件,最后systemctl start docker.service,發(fā)現(xiàn)docker啟動成功了。
以上所述是小編給大家介紹的docker.service啟動失敗:Unit not found的原因分析及解決辦法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
docker-compose部署MySQL8的實現(xiàn)
本文主要介紹了docker-compose部署MySQL8的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-11-11阿里云ECS部署Docker服務(wù)的實現(xiàn)步驟
本文主要介紹了阿里云ECS部署Docker服務(wù)的實現(xiàn)步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-06-06Docker CentOS7的系統(tǒng)上安裝部署以及基礎(chǔ)教程
這篇文章主要介紹了Docker CentOS7的系統(tǒng)上安裝部署以及基礎(chǔ)教程的相關(guān)資料,需要的朋友可以參考下2016-10-10Docker安裝阿里云服務(wù)器和在虛擬機(jī)安裝遇到的坑(問題小結(jié))
這篇文章主要介紹了Docker安裝阿里云服務(wù)器和在虛擬機(jī)安裝遇到的坑,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-03-03docker nginx 運(yùn)行后無法訪問的問題解決
這篇文章主要介紹了docker nginx 運(yùn)行后無法訪問的問題解決,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-09-09