'분류 전체보기' 카테고리의 글 목록 (10 Page)

Notice

Recent Posts

« 2024/12 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

관리 메뉴

목록분류 전체보기 (59)

🐥

[parquet-tools] parquet-tools schema myfile.parquet --> 파케이파일 스키마 출력 parquet-tools meta myfile.parquet --> 메타데이터 출력 parquet-tools cat myfile.parquet --> 파일 내용 출력

데이터/하둡 2022. 10. 5. 11:06

[CM] Yarn Node Manager 추가 시 ava.lang.IllegalArgumentException: java.net.UnknownHostException: HOSTNAME

yarn 에 들어가있는 어플리케이션이 하나도 안돌고 대기중이어서 Resorce Manager 역할 로그를 봤더니 아래와 같은 에러메시지 확인.. Error trying to assign container token and NM token to an updated container CONTAINER_NAME java.lang.IllegalArgumentException: java.net.UnknownHostException: HOST_NAME at org.apache.hadoop.security.SecurityUtil.buildTokenService(SecurityUtil.java:445) at org.apache.hadoop.yarn.server.utils.BuilderUtils.newContainerT..

데이터/하둡 2022. 5. 13. 15:02

[Spark] 데이터 로드 시 partition 경로를 column으로 가져오기

sparkConf = SpartConf().setAppName("test") sc = SparkContext.getOrCreate(conf=spartConf) hc = HiveContext(sc) df = hc.read.option("basePath", '/Path-to-data/')\ .parquet('/Path-to-data/') /Path-to-data/partition1=x/partition2=y 디렉토리가 이런 구조로 되어있을 때 위와 같이 데이터 로드 시 basePath 옵션을 추가하면 파티션 정보(위의 코드에서는 partition1, partition2) 가 dataframe의 컬럼으로 로드된다.

데이터/Spark 2022. 4. 27. 17:19

window vscode c++ 개발환경 세팅

https://velog.io/@andrewyoon10/VSCode%EC%97%90%EC%84%9C-CC-%EC%BB%B4%ED%8C%8C%EC%9D%BC-%EB%B0%8F-%EB%94%94%EB%B2%84%EA%B9%85-%ED%99%98%EA%B2%BD-%EB%A7%8C%EB%93%A4%EA%B8%B0 VSCode에서 C/C++ 컴파일 및 디버깅 환경 만들기 이번에는 Winodows에서 Visual Studio Code에디터에서 C/C++코드를 컴파일 및 디버깅하기 위한 기본적인 개발환경 구축에 대해서 포스팅 해보겠습니다. 단계별로 진행되며, 따라하시다 잘 안되는 부분이 velog.io https://webnautes.tistory.com/1158 https://urakasumi.tistory.com..

기타 2022. 3. 15. 11:54

Python을 통해 impala 접속

pip 설치: https://quackstudy.tistory.com/13?category=801005 1. impyla 라이브러리 사용 #pip install impyla from impala.dbapi import connect HOST = "host_ip" PORT = 21050 #default conn = connect(host=HOST, port=PORT) cursor = conn.cursor() query = "select * from default.table1 where some condition" cursor.execute(query) conn.close() 2. pyodbc 라이브러리 사용 1) cloudera odbc driver for impala 설치 https://docs.info..

데이터/하둡 2022. 3. 3. 13:40

이전 Prev 1 ··· 7 8 9 10 11 12 Next 다음

목록분류 전체보기 (59)

🐥

티스토리툴바