스파크1 [Spark] 스파크 개념 "스파크를 다루는 기술 Spark in Action"을 읽고 개인적으로 학습한 내용을 정리하는 포스터 입니다. 자세한 내용은 책을 참조해주세요. 출판사 웹 사이트 : https://www.gilbut.co.kr/book/view?bookcode=BN001997#bookData 1. 스파크란 빅데이터 처리를 위한 오픈소스 병렬 분산 처리 플랫폼 스파크는 잡에 필요한 데이터를 메모리에 캐시로 저장하는 인-메모리 실행 모델 (맵리듀스의 한계점은 맵리듀스 잡의 결과를 다른 잡에서 사용하려면 결과를 HDFS에 저장해야 함) 스칼라, 자바, 파이썬, R 등 다양한 프로그래밍 언어 지원 실시간 스트림 데이터 처리, 머신 러닝, SQL 연산, 그래프 알고리즘, 일괄 처리 등 여러 종류의 프로그램을 단일 프레임워크에서 .. 2021. 10. 20. 이전 1 다음