Showing posts with the label 데이터 엔지니어링

Kafka vs Pulsar 대규모 스트리밍 아키텍처 설계

현 대적인 분산 시스템에서 일일 수 테라바이트(TB)급의 데이터를 처리할 때, 가장 먼저 마주하는 병목은 애플리케이션 로직이 아닌 데이터 수집 및 전달 계층(Ingestion Layer)입니다. 많은 조직이 "업계 표준"이라는 이유만으로 Apache Kafka를 기본값으로 선택하지만, 데이터 규모가 페타바이트 수준으로 확장되거나 복잡한…
Kafka vs Pulsar 대규모 스트리밍 아키텍처 설계

과거의 데이터 파이프라인과 현대적 데이터 스택의 차이

모놀리식에서 마이크로서비스로, 온프레미스에서 클라우드로 전환되던 그 거대한 흐름처럼, 데이터 처리의 세계에도 지각변동이 일어났습니다. 과거의 데이터 파이프라인 구축 방식은 이제 '레거시'로 불리며, '현대적 데이터 스택(Modern Data Stack, MDS)'이라는 새로운 패러다임이 그 자리를 빠르게 대체하고 있습니다.…
과거의 데이터 파이프라인과 현대적 데이터 스택의 차이
OlderHomeNewest