1. PostgreSQL 오픈소스 RDB 표준 SQL 준수, 분석에 필요한 구문 제공 2. Apache Hive RDB에서 대량의 데이터를 처리할 때 보틀넥이 발생하는 데이터 I/O를 해결 고속으로 데이터를 처리하기 위한 아키텍처로 분산 파일 시스템이 고안됨 분산 파일 시스템 거대한 데이터를 작게 분할해서 여러 개의 디스크에 분산시켜 저장하고 각 디스크에서 동시에 데이터를 읽어 고속으로 대용량 처리가 가능함 하이브는 HDFS 분산파일 시스템 위의 데이터를 SQL스러운 인터페이스로 처리하는 시스템 동시에 처리한 데이터에 대한 순서를 맞춰주는 것이 중요한데, 이 방법이 MapReduce Hive → Hadoop 생태계의 일부, HiveQL로 MapReduce 잡으로 변환하여 병렬 분산 처리 수행 파일 기반 ..