🐥
Python을 통해 impala 접속 본문
pip 설치: https://quackstudy.tistory.com/13?category=801005
1. impyla 라이브러리 사용
#pip install impyla
from impala.dbapi import connect
HOST = "host_ip"
PORT = 21050 #default
conn = connect(host=HOST, port=PORT)
cursor = conn.cursor()
query = "select * from default.table1 where some condition"
cursor.execute(query)
conn.close()
2. pyodbc 라이브러리 사용
1) cloudera odbc driver for impala 설치
위 링크에서 step3까지 진행 (아래에선 DSN: impala로 설정)
#pip install pyodbc
import pyodbc
INFO = {
"DSN": "impala",
"user": "user_name",
"password": "user_password",
"UseSASL": 0
}
connString = '''DSN={0};UID={1};PWD={2};UseSasl={3};AuthMech=3'''.format(INFO['DSN'],INFO['user'],INFO['password'],INFO['UseSASL'])
conn = pyodbc.connect(connString, autoCommit=True)
cursor = conn.cursor()
query = "select * from default.table1 where some condition"
cursor.execute(query)
conn.close()
sentry 사용 등 권한문제가 있을 경우에는 impala daemon 이 있는 접속하려는 서버에 동일 계정이 있어야 함
3. 참고
쿼리실행결과 전체 출력
cursor.execute(query)
for row in cursor:
print('row = %r' % (row,))
'데이터 > 하둡' 카테고리의 다른 글
parquet 파일 정보 보기 (0) | 2022.10.05 |
---|---|
[CM] Yarn Node Manager 추가 시 ava.lang.IllegalArgumentException: java.net.UnknownHostException: HOSTNAME (0) | 2022.05.13 |
Apache Kafka (0) | 2022.02.11 |
Apache Flink (0) | 2022.02.11 |
하둡 에코시스템 (0) | 2022.02.11 |