유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

빅데이터 아키텍처에서 하둡 플랫폼과 카프카의 역할|HDFS, SPARK, KAFKA

데브원영 DVWY

2022. 2. 27.

0

#backend
#db
  • 하둡 플랫폼은 거대한 데이터를 처리하는 데 사용되는 오픈소스 배포 환경입니다. 🐘
  • HDFS는 거대한 양의 데이터를 저장하고 처리하는 분산 파일 시스템이며, Hive나 Spark와 같은 도구를 통해 데이터를 처리할 수 있습니다. 💾
  • Spark는 메모리에서 작동하는 빅 데이터 처리 도구로, 배치 데이터뿐만 아니라 스트림 데이터도 처리할 수 있습니다. ⚡️
  • Kafka는 실시간 데이터 처리를 위한 오픈소스 분산 이벤트 스트리밍 플랫폼입니다. 🌪️

Recommanded Videos