如何使用Python自動控制windows桌面
前言
在使用PC時與PC交互的主要途徑是看屏幕顯示、聽聲音,點擊鼠標和敲鍵盤等等。在自動化辦公的趨勢下,繁瑣的工作可以讓程序自動完成。比如自動化測試、自動下單交易等。很多軟件除了可以GUI方式操作外還可以用CLI接口操作,不過當一些軟件未提供CLI接口時,我們應(yīng)該怎么辦呢?我們還可以用程序控制桌面上的窗口、模擬點擊鼠標或按下鍵盤等動作來釋放自己。
pywin32是一個Python庫,它為Python提供訪問Windows API的擴展,提供了齊全的windows常量、接口、線程以及COM機制等等,安裝后會自帶一個pythonwin的IDE。接下來主要介紹下如何通過Python去操作windows桌面軟件。
1、打開軟件或文件
比如打開一個谷歌瀏覽器,或者打開一個word文件,如下所示:
win32api.ShellExecute(1, 'open', r'C:Program Files (x86)GoogleChromeApplicationchrome.exe', '', '', 1) win32api.ShellExecute(1, 'open', r'C:UsersJayDesktopEnvironment Guider.docx', '', '', 1)
win32api.ShellExecute()的參數(shù)主要包括:
- HWND:指定父窗口句柄
- Operation:指定動作, 譬如"edit",“explore”,“open”,“find”,“print”,“NULL”
- FileName:指定要打開的文件或程序
- Parameters:指定打開程序所需參數(shù)
- Directory:缺省目錄
- ShowCmd:打開選項,可選值:
- SW_HIDE = 0; {隱藏窗口,活動狀態(tài)給令一個窗口}
- SW_SHOWNORMAL = 1; {用最近的大小和位置顯示窗口, 同時令其進入活動狀態(tài)}
- SW_NORMAL = 1; {用當前的大小和位置顯示一個窗口,不改變活動窗口}
- SW_SHOWMINIMIZED = 2; {最小化窗口,并將其激活}
- SW_SHOWMAXIMIZED = 3; {最大化窗口,并將其激活}
- SW_MAXIMIZE = 3; {同 SW_SHOWMAXIMIZED}
- SW_SHOWNOACTIVATE = 4; {用最近的大小和位置顯示一個窗口,不改變活動窗口}
- SW_SHOW = 5; {用當前的大小和位置顯示一個窗口,令其進入活動狀態(tài)}
- SW_MINIMIZE = 6; {最小化窗口, 不激活}
- SW_SHOWMINNOACTIVE = 7; {同 SW_MINIMIZE}
- SW_SHOWNA = 8; {用當前的大小和位置顯示一個窗口,不改變活動窗口}
- SW_RESTORE = 9; {同 SW_SHOWNORMAL}
- SW_SHOWDEFAULT = 10; {同 SW_SHOWNORMAL}
- SW_MAX = 10; {同 SW_SHOWNORMAL}
執(zhí)行成功會返回應(yīng)用程序句柄, 如果返回值 <= 32,則表示執(zhí)行錯誤。返回值可能的錯誤有:
- 0—— {內(nèi)存不足}
- 2—— {文件名錯誤}
- 3—— {路徑名錯誤}
- 11—— {EXE 文件無效}
- 26—— {發(fā)生共享錯誤}
- 27—— {文件名不完全或無效}
- 28—— {超時}
- 29—— {DDE 事務(wù)失敗}
- 30—— {正在處理其他 DDE 事務(wù)而不能完成該 DDE 事務(wù)}
- 31—— {沒有相關(guān)聯(lián)的應(yīng)用程序}
2、查找窗體的句柄
在win32編程的世界里,包括窗口到文本框的所有控件都是窗體,所有的窗體都有獨立的句柄。要操作任意一個窗體,都需要找到這個窗體的句柄。句柄是一個32位整數(shù),在windows中用于標記對象。比如查找Snipping Tool和New Text Document.txt的句柄,如下所示:
para_hld = win32gui.FindWindow(None, "Snipping Tool")# 1836416 para_hld = win32gui.FindWindow(None, "New Text Document.txt - Notepad")# 591410
win32gui.FindWindow()屬于win32gui的模塊,它自頂層窗口(也就是桌面)開始搜索條件匹配的窗體,并返回這個窗體的句柄。該函數(shù)僅能查找主窗口,因此無法搜索子窗口,也不區(qū)分大小寫,未找到則返回0。
win32gui.FindWindow()的參數(shù)主要包括 (lpClassName=None, lpWindowName=None):
- lpClassName:字符型,窗體的類名,可以在Spy++里找到
- lpWindowName:字符型,窗口名,也就是標題欄上能看見的那個標題。
3、查找句柄的類名和標題
比如通過Snipping Tool和New Text Document.txt的句柄查找對應(yīng)的類名和標題,如下所示:
title = win32gui.GetWindowText(1836416) classname = win32gui.GetClassName(1836416) print "windows handler:{0}; title:{1}; classname:{2}".format(1836416, title, classname)
打印顯示如下:
windows handler:1836416; title:Snipping Tool; classname:Microsoft-Windows-Tablet-SnipperToolbar title = win32gui.GetWindowText(591410) classname = win32gui.GetClassName(591410) print "windows handler:{0}; title:{1}; classname:{2}".format(591410, title, classname)
打印顯示如下:
windows handler:591410; title:New Text Document.txt - Notepad; classname:Notepad
4、調(diào)用win32gui.EnumWindows()枚舉所有窗口句柄
直到最后一個頂層窗口被枚舉則停止枚舉過程。如下所示:
hWndList = [] win32gui.EnumWindows(lambda hWnd, param: param.append(hWnd), hWndList) print hWndList for hwnd in hWndList: title = win32gui.GetWindowText(hwnd) print title
打印顯示如下:
[852802L, 65946L, 65928L, 65930L, 65900L, 65920L, 65924L, 65922L, 65944L, 65892L, 65886L, 6817870L, 65960L, 6031410L, …… 66052L, 65734L] …… New Text Document.txt - Notepad Snipping Tool DDE Server Window OfficePowerManagerWindow OfficePowerManagerWindow DDE Server Window GDI+ Window Global Internet Access ……
5、win32gui.SetForegroundWindow()函數(shù)將指定窗體設(shè)置到最頂層,并且激活該窗口
構(gòu)造函數(shù)為:win32gui.SetWindowPos(HWN hWnd,HWND hWndlnsertAfter, int X,int Y, int cx,int cy, UNIT.Flags)
關(guān)于win32gui.SetForegroundWindow(para_hld)報錯的問題:
pywintypes.error: (0, ‘SetForegroundWindow', ‘No error message is available')
其實調(diào)用SetForegroundWindow()會有很多限制,參考官網(wǎng)的說明
因此調(diào)用SetForegroundWindow()時需要查看當前運行的條件是否符合上述要求,此處在調(diào)用SetForegroundWindow()前事先發(fā)送一個鍵盤event來解決該問題。
例程如下所示:
win32api.keybd_event(13, 0, 0, 0) # win32gui.SetForegroundWindow(para_hld)
6、win32api.keybd_event()模擬鍵盤輸入
構(gòu)造函數(shù)如下所示:
win32api.keybd_event (bVk, bScan, dwFlags, dwExtraInfo)
- bVk:虛擬鍵碼(鍵盤鍵碼對照表見附錄);
- bScan:硬件掃描碼,一般設(shè)置為0即可;
- dwFlags:函數(shù)操作的一個標志位,如果值為KEYEVENTF_EXTENDEDKEY則該鍵被按下,也可設(shè)置為0即可,如果值為KEYEVENTF_KEYUP則該按鍵被釋放;
- dwExtraInfo:定義與擊鍵相關(guān)的附加的32位值,一般設(shè)置為0即可。
按下enter鍵后抬起的例程如下所示:
win32api.keybd_event(13,0,0,0) # enter win32api.keybd_event(13,0,win32con.KEYEVENTF_KEYUP,0) #釋放按鍵
7、模擬鼠標輸入
直接給出例程,如下所示:
# 獲取鼠標當前位置的坐標 print win32api.GetCursorPos() # 將鼠標移動到坐標處 win32api.SetCursorPos((100, 100)) # 左點擊 win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN, 100, 100, 0, 0) time.sleep(2) win32api.mouse_event(win32con.MOUSEEVENTF_LEFTUP, 100, 100, 0, 0)
8、關(guān)于鼠標鍵盤的操作還可以使用PyUserInput庫
PyUserInput是一個使用python的跨平臺的操作鼠標和鍵盤的模塊,使用非常方便。支持的平臺及依賴如下:
- Linux - Xlib
- Mac - Quartz, AppKit
- Windows - pywin32, pyHook
實例化一個鼠標和鍵盤對象,如下所示:
from pymouse import PyMouse from pykeyboard import PyKeyboard m = PyMouse() k = PyKeyboard() 操作鼠標和鍵盤,如下所示: m.click(190,70,1)#移動并且在xy位置點擊 time.sleep(2) m.click(190, 200, 1)#移動并且在xy位置點擊 time.sleep(2) k.tap_key(k.function_keys[5])#–點擊功能鍵F5
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
使用Cython中prange函數(shù)實現(xiàn)for循環(huán)的并行
Cython中提供了一個prange函數(shù),專門用于循環(huán)的并行執(zhí)行。這個 prange的特殊功能是Cython獨一無二的,并且prange只能與for循環(huán)搭配使用,不能獨立存在。本文就將使用 prange 實現(xiàn) for 循環(huán)的并行,感興趣的可以了解一下2022-08-08python?命令行參數(shù)模塊argparse的實現(xiàn)
本文主要介紹了python?命令行參數(shù)模塊argparse的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2023-03-03