欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

使用python客戶端訪問impala的操作方式

 更新時(shí)間:2020年03月28日 09:36:40   作者:faith默默  
這篇文章主要介紹了使用python客戶端訪問impala的操作方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

因需要將impala僅僅作為數(shù)據(jù)源使用,而python有較好的數(shù)據(jù)分析函數(shù),所以需要使用python客戶端來獲取impala中的表數(shù)據(jù),這里的測(cè)試環(huán)境是:

操作系統(tǒng):win7 (linux下也可行)

python 2.7

大數(shù)據(jù)環(huán)境:centos6.6

CDH版本:CDH5.4.1

impala 2.1.2 port:21050

1、安裝Python package

pip install impyla

2、python客戶端與impala交互

2.1 連接impala

>>> from impala.dbapi import connect
>>> conn = connect(host='my.impala.host', port=21050)
>>> cur = conn.cursor()

注意:這里要確保端口設(shè)置為HS2服務(wù),而不是Beeswax服務(wù)。在Cloudera的管理集群中,HS2的默認(rèn)端口是21050。 (Beeswax默認(rèn)端口21000)

2.2 對(duì)impala執(zhí)行SQL查詢

>>> cur.execute('SHOW TABLES')
>>> cur.fetchall()
[('defect_code_dim',), ('gxzl_ca_materialinfo',), ('gxzl_cg_materialinfo',), ('gxzl_defect2',), ('gxzl_defects',), ('gxzl_defects_hd',), ('gxzl_fx_class',), ('gxzl_fx_leftmidright',), ('gxzl_fx_topandbot',), ('gxzl_jiejing_2cc_slab',), ('gxzl_kgx_drw',), ('gxzl_kgx_drw_tmp',), ('gxzl_rz_materialinfo',), ('gxzl_sdbase_defects',), ('gxzl_test',), ('new_table',), ('ouye_transactionlog',), ('ouye_userinfo',), ('simple_test',), ('t0',), ('t_100m_hdfs',), ('t_100m_test',), ('t_10m_hdfs',), ('target1',), ('target2',), ('target3',), ('test',), ('tianchi_mobile_recommend_train_full',), ('tianchi_mobile_recommend_train_item',), ('tianchi_mobile_recommend_train_user',), ('tianchi_mobile_recommend_train_useritem',)]
>>> cur.execute('SELECT * FROM test')
>>> cur.description
[('id', 'DOUBLE', None, None, None, None, None), ('name', 'STRING', None, None, None, None, None), ('value', 'STRING', None, None, None, None, None)]
>>> cur.fetchall()
[(1.0, 'tom', 'f'), (2.0, 'jerry', 't')]
>>> 

注意:從服務(wù)器上獲取數(shù)據(jù)會(huì)刪除緩存,所以第二個(gè).fetchall()返回一個(gè)空列表。

>>> cur.fetchall()
[(1.0, 'tom', 'f'), (2.0, 'jerry', 't')]
>>> cur.fetchall()
[]
>>>

2.3 遍歷查詢結(jié)果

>>> cur.execute('SELECT * FROM test')
>>> for row in cur:
  print row[1] == 1.0


False
False

注:python的角標(biāo)是以0開始。以上仍是以緩存方式來獲取數(shù)據(jù)。

如果你的數(shù)據(jù)集較小可以使用這種方式;如果你需要存儲(chǔ)大量的數(shù)據(jù)集,你可以用CREATE TABLE AS SELECT語(yǔ)句把它寫入HDFS。

2.4 將查詢結(jié)果轉(zhuǎn)化為python中的pandas DataFrames

除了遍歷結(jié)果以外,還可以把結(jié)果轉(zhuǎn)化成pandas的數(shù)據(jù)框?qū)ο螅员氵M(jìn)行數(shù)據(jù)分析:

>>> from impala.dbapi import connect
>>> conn = connect(host='my.impala.host', port=21050)
>>> cur = conn.cursor()
>>> from impala.util import as_pandas
>>> cur.execute('SELECT * FROM test')
>>> df = as_pandas(cur)
>>> type(df)
<class 'pandas.core.frame.DataFrame'>
>>> df
  id  name value
0  1  tom   f
1  2 jerry   t
>>> 

注:前提是python中安裝了pandas,使用pip install pandas在線安裝,安裝過程中可能會(huì)提示:Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27

只要按照提示說的的去下載一個(gè)VC就可以了。這樣就安裝好了pandas。

以上這篇使用python客戶端訪問impala的操作方式就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • 詳談Python中列表list,元祖tuple和numpy中的array區(qū)別

    詳談Python中列表list,元祖tuple和numpy中的array區(qū)別

    下面小編就為大家分享一篇詳談Python中列表list,元祖tuple和numpy中的array區(qū)別,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • PaddleOCR 識(shí)別表情包文字示例詳解

    PaddleOCR 識(shí)別表情包文字示例詳解

    這篇文章主要為大家介紹了PaddleOCR 識(shí)別表情包文字示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-08-08
  • Python?pandas修剪函數(shù)clip使用實(shí)例探究

    Python?pandas修剪函數(shù)clip使用實(shí)例探究

    在數(shù)據(jù)處理和分析中,經(jīng)常面臨著需要限制數(shù)據(jù)范圍的情況,而pandas庫(kù)提供的clip函數(shù)就是一個(gè)強(qiáng)大的工具,可以方便地對(duì)數(shù)據(jù)進(jìn)行修剪,本文將深入介紹clip函數(shù)的基本用法、常見參數(shù)以及實(shí)際場(chǎng)景中的應(yīng)用,以幫助大家充分理解并靈活運(yùn)用這一功能
    2024-01-01
  • python代碼實(shí)現(xiàn)猜拳小游戲

    python代碼實(shí)現(xiàn)猜拳小游戲

    這篇文章主要為大家詳細(xì)介紹了python代碼實(shí)現(xiàn)猜拳小游戲,以文本文件存儲(chǔ)與調(diào)用信息,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-11-11
  • PIL包中Image模塊的convert()函數(shù)的具體使用

    PIL包中Image模塊的convert()函數(shù)的具體使用

    這篇文章主要介紹了PIL包中Image模塊的convert()函數(shù)的具體使用,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-02-02
  • Python 數(shù)據(jù)的累加與統(tǒng)計(jì)的示例代碼

    Python 數(shù)據(jù)的累加與統(tǒng)計(jì)的示例代碼

    這篇文章主要介紹了Python 數(shù)據(jù)的累加與統(tǒng)計(jì)的示例代碼,文中講解非常細(xì)致,代碼幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下
    2020-08-08
  • python爬取微信公眾號(hào)文章

    python爬取微信公眾號(hào)文章

    這篇文章主要為大家詳細(xì)介紹了python爬蟲實(shí)戰(zhàn)案例,微信公眾號(hào)文章的爬取,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-08-08
  • 詳解Python3中的迭代器和生成器及其區(qū)別

    詳解Python3中的迭代器和生成器及其區(qū)別

    本篇將介紹Python3中的迭代器與生成器,描述可迭代與迭代器關(guān)系,并實(shí)現(xiàn)自定義類的迭代器模式。非常具有實(shí)用價(jià)值,需要的朋友可以參考下
    2018-10-10
  • python中三種高階函數(shù)(map,reduce,filter)詳解

    python中三種高階函數(shù)(map,reduce,filter)詳解

    在Python中,函數(shù)其實(shí)也是一種數(shù)據(jù)類型,今天重點(diǎn)給大家介紹python中三種高階函數(shù)(map,reduce,filter)的相關(guān)知識(shí),感興趣的朋友一起看看吧
    2021-10-10
  • Python協(xié)程操作之gevent(yield阻塞,greenlet),協(xié)程實(shí)現(xiàn)多任務(wù)(有規(guī)律的交替協(xié)作執(zhí)行)用法詳解

    Python協(xié)程操作之gevent(yield阻塞,greenlet),協(xié)程實(shí)現(xiàn)多任務(wù)(有規(guī)律的交替協(xié)作執(zhí)行)用法詳解

    這篇文章主要介紹了Python協(xié)程操作之gevent(yield阻塞,greenlet),協(xié)程實(shí)現(xiàn)多任務(wù)(有規(guī)律的交替協(xié)作執(zhí)行)用法,結(jié)合實(shí)例形式較為詳細(xì)的分析了協(xié)程的功能、原理及gevent、greenlet實(shí)現(xiàn)協(xié)程,以及協(xié)程實(shí)現(xiàn)多任務(wù)相關(guān)操作技巧,需要的朋友可以參考下
    2019-10-10

最新評(píng)論