2. CROSS-PLATFORM PROCESSING
애플리케이션이 교차 플랫폼 데이터 처리에 대한 지원을 필요로 하는 4가지 상황이 있다. 그림 2는 이 4가지 경우를 보여준다.
(1) 플랫폼 독립성. 애플리케이션은 전체 작업을 단일 플랫폼에서 실행하지만 일반적으로 더 나은 성능을 달성하는 것을 목표로 다른 입력 데이터셋 또는 작업에 대해 플랫폼 전환을 요구할 수 있다.(그림 2(a))
(2) 기회적 교차 플랫폼. 애플리케이션은 또한 하나의 작업을 실행하기 위해 여러 개의 플랫폼을 사용함으로써 성능 면에서 도움이 될 수 있다.(그림 2(b))
(3) 필수적인 교차플랫폼. 입력 데이터가 있는 플랫폼 때문에 애플리케이션에 복수의 플랫폼이 필요할 수 있다.
e.g., PostgreSQL은 수신 작업을 수행할 수 없음, e.g., 기계 학습 작업. 따라서, 데이터가 있는 플램폼에서 다른 플랫폼으로 이동해야 한다.(그림 2(c))
(4) 복수 저장소. 입력 데이터가 복수의 저장소에 저장되기 때문에 애플리케이션에 복수의 플랫폼이 필요할 수 있다. (그림 2(d))
기존 시스템과 비교하여 Rheem은 위의 모든 경우에 사용자를 돕는다. 이 시스템의 설계는 주로 4가지 애플리케이션에 의해 추진되었다. 데이터 청소 애플리케이션(BigDansing), 기계학습 애플리케이션(ML4all), 데이터베이스 애플리케이션(xDB), end-to-end 데이터 검색 및 준비 애플리케이션(data Civilizer). 이러한 애플리케이션을 사용하여 성능 및 사용 편의성 측면에서 단일 플랫폼 데이터 처리 대신 교차 플랫폼 데이터 처리 수행의 이점을 보여준다.