여기 귀엽게 생긴 코끼리와 함께 있는 하둡이라는 것을 알아봅니다.
여기저기 지나다니면서 하둡이라고 몇번 들어봤는데 빅데이터 분석을 할 수 있는 소프트웨어라고 합니다.
좋은 컴퓨터 하나로 모든 것을 연산하는 대신, 여러대 컴퓨터를 병렬로 이용해서 처리 속도를 올리는 분산처리 프레임워크입니다.
얘가 알아서 데이터 유실을 방지해주고, 데이터 무결성을 유지하고 등등 빅테이터 처리를 할 때 손이 많이가는 부분을 대부분 해줍니다.
항상 모든 것에는 장단점이 있죠
장점부터 볼까요
오픈소스라 공짜
저렴한 구축 비용
일부 장애가 생겨도, 모든 데이터가 손상되는 것이 아님
뭐 이런 장점들이 있는데
단점은 무엇일까요?
HDFS에 저장된 데이터 변경 불가(장점이라고 할 수도 있겠네요)
세팅하기 귀찮음(전문적으로 세팅해주는 업체가 별로 없다고 합니다)
'개발 > 잡다개발' 카테고리의 다른 글
XSS 란 (0) | 2019.09.03 |
---|---|
SQL INJECTION (0) | 2019.09.02 |
비밀번호 암호화 (0) | 2019.08.19 |
RESTful API란 (0) | 2019.08.18 |
JWT(Json Web Token) 이란 (0) | 2019.08.17 |