여기 귀엽게 생긴 코끼리와 함께 있는 하둡이라는 것을 알아봅니다. 여기저기 지나다니면서 하둡이라고 몇번 들어봤는데 빅데이터 분석을 할 수 있는 소프트웨어라고 합니다. 좋은 컴퓨터 하나로 모든 것을 연산하는 대신, 여러대 컴퓨터를 병렬로 이용해서 처리 속도를 올리는 분산처리 프레임워크입니다. 얘가 알아서 데이터 유실을 방지해주고, 데이터 무결성을 유지하고 등등 빅테이터 처리를 할 때 손이 많이가는 부분을 대부분 해줍니다. 항상 모든 것에는 장단점이 있죠 장점부터 볼까요 오픈소스라 공짜 저렴한 구축 비용 일부 장애가 생겨도, 모든 데이터가 손상되는 것이 아님 뭐 이런 장점들이 있는데 단점은 무엇일까요? HDFS에 저장된 데이터 변경 불가(장점이라고 할 수도 있겠네요) 세팅하기 귀찮음(전문적으로 세팅해주는 업..