如何在Win10系統(tǒng)使用Python3連接Hive
由于數(shù)據(jù)存放在大數(shù)據(jù)平臺的Hive數(shù)據(jù)倉庫中,我需要在Win10系統(tǒng)上利用Python3連接Hive,然后讀取數(shù)據(jù),進行探索、分析和挖掘工作。
我通過網(wǎng)上查找資料和實際測試,把Win10系統(tǒng)Python3成功連接Hive配置總結(jié)如下。
第一步:安裝依賴庫
pip install bitarray pip install bit_array pip install thrift pip install thriftpy pip install pure_sasl pip install --no-deps thrift-sasl==0.2.1
提示:若是無法安裝,也可以點擊如下網(wǎng)址,
https://www.lfd.uci.edu/~gohlke/pythonlibs/
選擇合適庫的whl下載,然后進行本地化安裝。
第二步:安裝impyla庫
我采用本地化安裝方式,先下載impyla庫的whl,如下圖:
再安裝
pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl
提示:上面的絕對路徑根據(jù)你自己的情況而定
第三步:測試impyla庫是否可以使用
from impala.dbapi import connect #用來連接Hive的函數(shù) from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandas
若是運行通過,表示利用impala連接Hive配置成功。
簡單示例:
從Hive的一張表讀取100條記錄,放到pandas的DataFrame里面。
參考代碼:
from impala.dbapi import connect #用來連接Hive的函數(shù) from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandas conn = connect(host='my.host.com', port=21050) cursor = conn.cursor() cursor.execute('SELECT * FROM mytable LIMIT 100') df = as_pandas(cursor) cursor.close()
參考資料
https://github.com/cloudera/impyla
以上就是如何在Win10系統(tǒng)使用Python3連接Hive的詳細內(nèi)容,更多關(guān)于Python3連接Hive的資料請關(guān)注腳本之家其它相關(guān)文章!
- 如何在Win10系統(tǒng)使用Python3連接Hive
- 在python中使用pyspark讀寫Hive數(shù)據(jù)操作
- 使用Python構(gòu)造hive insert語句說明
- python3.6.5基于kerberos認證的hive和hdfs連接調(diào)用方式
- python 實現(xiàn) hive中類似 lateral view explode的功能示例
- Python pandas 列轉(zhuǎn)行操作詳解(類似hive中explode方法)
- python 操作hive pyhs2方式
- 如何在python中寫hive腳本
- python處理數(shù)據(jù),存進hive表的方法
- python導(dǎo)出hive數(shù)據(jù)表的schema實例代碼
相關(guān)文章
Python實現(xiàn)指定數(shù)組下標值正序與倒序排序算法功能舉例
在程序中,經(jīng)常需要按數(shù)組倒序或反序重新排列數(shù)組,下面這篇文章主要給大家介紹了關(guān)于Python實現(xiàn)指定數(shù)組下標值正序與倒序排序算法功能的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2023-02-02Python實戰(zhàn)之markdown轉(zhuǎn)pdf(包含公式轉(zhuǎn)換)
由于我們markdown編輯器比較特殊,不是很方便瀏覽,如果轉(zhuǎn)換成pdf的話,就不需要可以的去安裝各種編輯器才可以看了。所以本文將介紹如何通過Python實現(xiàn)md轉(zhuǎn)pdf或者是docx,需要的朋友可以參考一下2021-12-12python使用seaborn繪圖直方圖displot,密度圖,散點圖
這篇文章主要介紹了python使用seaborn繪圖直方圖displot,密度圖,散點圖,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-07-07python?HTTP協(xié)議相關(guān)庫requests urllib基礎(chǔ)學(xué)習(xí)
這篇文章主要介紹了python?HTTP協(xié)議相關(guān)庫requests urllib基礎(chǔ)學(xué)習(xí),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-06-067個流行的Python強化學(xué)習(xí)算法及代碼實現(xiàn)詳解
目前流行的強化學(xué)習(xí)算法包括?Q-learning、SARSA、DDPG、A2C、PPO、DQN?和?TRPO。這些算法已被用于在游戲、機器人和決策制定等各種應(yīng)用中,本文我們將對其做一個簡單的介紹,感興趣的可以學(xué)習(xí)一下2023-01-01