使用實(shí)現(xiàn)python連接hive數(shù)倉的示例代碼
1 版本參數(shù)
查看hadoop和hive的版本號
ls -l /opt # 總用量 3 # drwxr-xr-x 11 root root 227 1月 26 19:23 hadoop-3.3.6 # drwxr-xr-x 10 root root 205 2月 12 18:53 hive-3.1.3 # drwxrwxrwx. 4 root root 32 2月 11 22:19 tmp
查看java版本號
java -version # java version "1.8.0_391" # Java(TM) SE Runtime Environment (build 1.8.0_391-b13) # Java HotSpot(TM) 64-Bit Server VM (build 25.391-b13, mixed mode)
查看mysql版本號
mysql --version # mysql Ver 8.0.35 for Linux on x86_64 (MySQL Community Server - GPL)
2 啟動環(huán)境
啟動hadoop集群
start-all.sh # WARNING: HADOOP_SECURE_DN_USER has been replaced by HDFS_DATANODE_SECURE_USER. Using value of HADOOP_SECURE_DN_USER. # Starting namenodes on [ml] # 上一次登錄:三 3月 6 23:34:59 CST 2024tty1 上 # Starting datanodes # 上一次登錄:三 3月 6 23:37:56 CST 2024pts/0 上 # Starting secondary namenodes [ml] # 上一次登錄:三 3月 6 23:38:01 CST 2024pts/0 上 # Starting resourcemanager # 上一次登錄:三 3月 6 23:38:30 CST 2024pts/0 上 # Starting nodemanagers # 上一次登錄:三 3月 6 23:39:01 CST 2024pts/0 上
查看hadoop集群狀態(tài)
jps|sort # 2337 NameNode # 2548 DataNode # 3161 ResourceManager # 3379 NodeManager # 5654 Jps
啟動hiveserver2服務(wù)
nohup hiveserver2 & # [1] 7486 # (pyspark) (base) [root@~ ~]# nohup: 忽略輸入并把輸出追加到"nohup.out" #
檢測hiveserver2狀態(tài)
jps|grep 7486 # 7486 RunJar
檢測thrift端口號狀態(tài)
netstat -anp|grep 10000 # tcp6 0 0 :::10000 :::* LISTEN 7486/java
3 安裝環(huán)境
安裝python第三方庫
conda install sasl conda install thrift conda install thrift-sasl conda install pyhive conda install sqlalchemy conda install pandas
使用everything檢索sasl2文件夾并打開該文件夾
在open git bash here窗口查看sasl2里面的文件
ls # saslANONYMOUS.dll* saslLOGIN.dll* saslPLAIN.dll* saslSQLITE.dll* # saslCRAMMD5.dll* saslNTLM.dll* saslSASLDB.dll* saslSRP.dll* # saslDIGESTMD5.dll* saslOTP.dll* saslSCRAM.dll*
創(chuàng)建C:/CMU/bin/sasl2文件夾
拷貝當(dāng)前文件夾的dll文件到C:/CMU/bin/sasl2文件夾中
mkdir -p C:/CMU/bin/sasl2 cp ./* C:/CMU/bin/sasl2/
4 讀取數(shù)據(jù)
編寫python腳本連接hive數(shù)倉
import pandas as pd from pyhive import hive from sqlalchemy import create_engine engine = create_engine('hive://root:ml123456@ml:10000/default?auth=LDAP') df = pd.read_sql_query('show databases',con=engine) df.head()
能看到數(shù)據(jù)庫名記錄就證明連接成功
到此這篇關(guān)于使用實(shí)現(xiàn)python連接hive數(shù)倉的示例代碼的文章就介紹到這了,更多相關(guān)python連接hive數(shù)倉內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python selenium 自動化腳本打包成一個(gè)exe文件(推薦)
這篇文章主要介紹了Python selenium 自動化腳本打包成一個(gè)exe文件,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-01-01python中Tkinter詳細(xì)基礎(chǔ)教學(xué)實(shí)例代碼
這篇文章主要給大家介紹了關(guān)于python中Tkinter詳細(xì)基礎(chǔ)教學(xué)的相關(guān)資料,文中介紹了如Label、Button、Entry、Text、Frame、Menu、Canvas、Messagebox等的基本屬性和用法,并介紹了布局管理器pack、grid和place的使用方法,需要的朋友可以參考下2024-12-12對Python發(fā)送帶header的http請求方法詳解
今天小編就為大家分享一篇對Python發(fā)送帶header的http請求方法詳解,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01Python基于twisted實(shí)現(xiàn)簡單的web服務(wù)器
這篇文章主要介紹了Python基于twisted實(shí)現(xiàn)簡單的web服務(wù)器,可模擬出簡單的web服務(wù)器功能,是很實(shí)用的技巧,需要的朋友可以參考下2014-09-09pandas之關(guān)于DataFrame數(shù)據(jù)類型超好用的方法
這篇文章主要介紹了pandas之關(guān)于DataFrame數(shù)據(jù)類型超好用的方法,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-11-11Python使用Dask進(jìn)行大規(guī)模數(shù)據(jù)處理
在數(shù)據(jù)科學(xué)和數(shù)據(jù)分析領(lǐng)域,數(shù)據(jù)集的規(guī)模不斷增長,傳統(tǒng)的單機(jī)處理方式往往無法滿足需求,為了解決這個(gè)問題,Dask應(yīng)運(yùn)而生,Dask是一個(gè)靈活的并行計(jì)算庫,可以輕松地處理大規(guī)模數(shù)據(jù)集,本文將介紹Dask的基本概念、安裝方法以及如何使用Dask進(jìn)行高效的數(shù)據(jù)處理2024-11-11