如何在Win10系統(tǒng)使用Python3連接Hive
由于數(shù)據(jù)存放在大數(shù)據(jù)平臺(tái)的Hive數(shù)據(jù)倉庫中,我需要在Win10系統(tǒng)上利用Python3連接Hive,然后讀取數(shù)據(jù),進(jìn)行探索、分析和挖掘工作。
我通過網(wǎng)上查找資料和實(shí)際測試,把Win10系統(tǒng)Python3成功連接Hive配置總結(jié)如下。
第一步:安裝依賴庫
pip install bitarray pip install bit_array pip install thrift pip install thriftpy pip install pure_sasl pip install --no-deps thrift-sasl==0.2.1
提示:若是無法安裝,也可以點(diǎn)擊如下網(wǎng)址,
https://www.lfd.uci.edu/~gohlke/pythonlibs/
選擇合適庫的whl下載,然后進(jìn)行本地化安裝。
第二步:安裝impyla庫
我采用本地化安裝方式,先下載impyla庫的whl,如下圖:
再安裝
pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl
提示:上面的絕對(duì)路徑根據(jù)你自己的情況而定
第三步:測試impyla庫是否可以使用
from impala.dbapi import connect #用來連接Hive的函數(shù) from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandas
若是運(yùn)行通過,表示利用impala連接Hive配置成功。
簡單示例:
從Hive的一張表讀取100條記錄,放到pandas的DataFrame里面。
參考代碼:
from impala.dbapi import connect #用來連接Hive的函數(shù) from impala.util import as_pandas #用來把數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為pandas conn = connect(host='my.host.com', port=21050) cursor = conn.cursor() cursor.execute('SELECT * FROM mytable LIMIT 100') df = as_pandas(cursor) cursor.close()
參考資料
https://github.com/cloudera/impyla
以上就是如何在Win10系統(tǒng)使用Python3連接Hive的詳細(xì)內(nèi)容,更多關(guān)于Python3連接Hive的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
- 如何在Win10系統(tǒng)使用Python3連接Hive
- 在python中使用pyspark讀寫Hive數(shù)據(jù)操作
- 使用Python構(gòu)造hive insert語句說明
- python3.6.5基于kerberos認(rèn)證的hive和hdfs連接調(diào)用方式
- python 實(shí)現(xiàn) hive中類似 lateral view explode的功能示例
- Python pandas 列轉(zhuǎn)行操作詳解(類似hive中explode方法)
- python 操作hive pyhs2方式
- 如何在python中寫hive腳本
- python處理數(shù)據(jù),存進(jìn)hive表的方法
- python導(dǎo)出hive數(shù)據(jù)表的schema實(shí)例代碼
相關(guān)文章
python 對(duì)一幅灰度圖像進(jìn)行直方圖均衡化
這篇文章主要介紹了python 如何對(duì)一幅灰度圖像進(jìn)行直方圖均衡化,幫助大家更好的利用python處理圖像,感興趣的朋友可以了解下2020-10-10Python實(shí)現(xiàn)指定數(shù)組下標(biāo)值正序與倒序排序算法功能舉例
在程序中,經(jīng)常需要按數(shù)組倒序或反序重新排列數(shù)組,下面這篇文章主要給大家介紹了關(guān)于Python實(shí)現(xiàn)指定數(shù)組下標(biāo)值正序與倒序排序算法功能的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-02-02Python實(shí)戰(zhàn)之markdown轉(zhuǎn)pdf(包含公式轉(zhuǎn)換)
由于我們markdown編輯器比較特殊,不是很方便瀏覽,如果轉(zhuǎn)換成pdf的話,就不需要可以的去安裝各種編輯器才可以看了。所以本文將介紹如何通過Python實(shí)現(xiàn)md轉(zhuǎn)pdf或者是docx,需要的朋友可以參考一下2021-12-12python使用seaborn繪圖直方圖displot,密度圖,散點(diǎn)圖
這篇文章主要介紹了python使用seaborn繪圖直方圖displot,密度圖,散點(diǎn)圖,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-07-07python?HTTP協(xié)議相關(guān)庫requests urllib基礎(chǔ)學(xué)習(xí)
這篇文章主要介紹了python?HTTP協(xié)議相關(guān)庫requests urllib基礎(chǔ)學(xué)習(xí),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-06-067個(gè)流行的Python強(qiáng)化學(xué)習(xí)算法及代碼實(shí)現(xiàn)詳解
目前流行的強(qiáng)化學(xué)習(xí)算法包括?Q-learning、SARSA、DDPG、A2C、PPO、DQN?和?TRPO。這些算法已被用于在游戲、機(jī)器人和決策制定等各種應(yīng)用中,本文我們將對(duì)其做一個(gè)簡單的介紹,感興趣的可以學(xué)習(xí)一下2023-01-01