본문 바로가기

분류 전체보기20

MySQL ORACLE HIVE 그룹별 문자열 묶기 LISTAGG GROUP_CONCAT collect_set 그룹별로 문자열 묶는 방법 그룹별로 group by 하여 다른 특정 컬럼 문자열을 묶어서 나타내고 싶을 때 사용하는 함수를 mysql, oracle, hive 데이터 베이스별로 정리 테이블 예제 - 테이블 : custuer_grade grade custumer_id gold park123 sliver kim124 sliver lee777 gold han909 bronze jee333 원하는 결과 grade custumer_id gold park123,han909 sliver kim124,lee777 bronze jee333 MySQL 문법 : GROUP_CONCAT(column ORDER BY column SEPERATOR 구분자) ~ group by(column) SELECT grade, GROUP_C.. 2021. 10. 28.
[경제용어] 테이퍼링(tapering) 뜻과 유래 🚩 테이퍼링이란 ? 양적완화 정책의 규모를 점진적으로 축소해나가는 것 테이퍼링의 뜻을 살펴보면 양적완화 정책의 규모를 점진적으로 축소해 나가는 것이라고 하는데 양적완화란 무슨 뜻일까? 양적완화란 기준금리 수준이 낮아 금리 인하를 통한 효과를 기대할 수 없을 때 중앙은행이 자산을 사들여 시중에 통화공급을 늘리는 정책이다. 즉 시중에 돈을 푸는 것입니다. 이번 코로나로 인해 경기둔화를 우려하여 여러 나라에서 기준금리 인하를 하였는데 기준금리를 내리게 되면 은행의 예금금리와 대출금리도 낮아져 가계나 기업은 이자가 낮게 돈을 빌릴 수 있고 낮아진 예금금리에 예금 비율을 줄여 투자나 소비가 촉진되어 경제가 활성화될 수 있습니다. 그런데 이렇게 기준금리를 계속 내리더라도 경제가 살아나지 않으면 중앙은행에서는 양적완.. 2021. 10. 23.
[개발] Spark SQL DataFrame Vector to Array LogisticRegression으로 모델 학습한 결과 테이블 중에서 rawprediction, probability 값이 vector 형태로 나오는데 spark sql에서 인덱스 1 값을 가지고 오고 싶어서 방법 찾던 중 해결한 방법. 추후에 spark를 더 공부한 후 다른 방법을 찾으면 글 업데이트할 예정. 현재 사용하고 있는 Spark 버전은 Spark 2.3.1 spark 3.0.0 버전 부터는 vector_to_array 함수 제공 Spark DataFrame 스키마에 column dataType이 vector인 경우가 있을 때 Spark Sql에서 데이터를 꺼내오기 위해 아래와 같이 처리함. vector 가 포함되어 있는 데이터 프레임 스키마 withColumn : 데이터 프레임에 새로운 컬럼.. 2021. 10. 21.
[Spark] 스파크 개념 "스파크를 다루는 기술 Spark in Action"을 읽고 개인적으로 학습한 내용을 정리하는 포스터 입니다. 자세한 내용은 책을 참조해주세요. 출판사 웹 사이트 : https://www.gilbut.co.kr/book/view?bookcode=BN001997#bookData 1. 스파크란 빅데이터 처리를 위한 오픈소스 병렬 분산 처리 플랫폼 스파크는 잡에 필요한 데이터를 메모리에 캐시로 저장하는 인-메모리 실행 모델 (맵리듀스의 한계점은 맵리듀스 잡의 결과를 다른 잡에서 사용하려면 결과를 HDFS에 저장해야 함) 스칼라, 자바, 파이썬, R 등 다양한 프로그래밍 언어 지원 실시간 스트림 데이터 처리, 머신 러닝, SQL 연산, 그래프 알고리즘, 일괄 처리 등 여러 종류의 프로그램을 단일 프레임워크에서 .. 2021. 10. 20.