Spark 2편 – Caching 및 Persist 베스핀글로벌 Backend 2025년 3월 25일 24 AI 요약 이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다. Spark 2편 – Caching 및 Persist이 게시물은 Spark의 Caching 및 Persist 기능에 대해 설명합니다.주요 기능Cache()를 사용하여 메모리 전용 또는 메모리와 디스크 병행 활용Persist()를 통해 다양한 저장 옵션 제공spill over 문제RDD를 캐시하면 메모리 공간이 한정적이기 때문에 과도한 캐싱은 디스크 spill over를 초래할 수 있습니다. 이 경우 성능이 저하될 수 있으며, 해결 방안으로는 Executor 메모리 증가, Cache Clear, 파티션 재정렬 등이 있습니다. 연관 게시글 Spark 4편 – Broadcast 베스핀글로벌 27 2025년 3월 27일 Spark 3편 – Optimize Partition 베스핀글로벌 46 2025년 3월 25일 Spark 1편 – Backend Service – Optimizer 베스핀글로벌 61 2025년 3월 25일 뒤로가기 공유하기 원문 보기