딜라이트닷넷

카산드라

다음의 빅데이터 활용기 : 하둡

백지영 기자의 데이터센터 트랜스포머 12.11.19 15:45

“하둡은 Ad-Hoc 쿼리 구현이 어렵고 실시간 분석에 적합하지 못했고, NoSQL은 복잡한 형태의 데이터 분석이 어렵다는 단점이 있었습니다. 이 때문에 그린플럼 DB에 주목하게 됐고, 이들을 효율적으로 함께 사용할 수 있는 방안을 고려하게 됐죠.”국내 대표적인 인터넷 서비스 기업인 다음커뮤니케이션은 다양한 오픈소스를 활용하기로 유명합니다. 최근 화두가 되고 있는 빅데이터 분석에 있어서도 마찬가지입니다. 다음은 이미 지난 2009년 대용량의 데이터를 활용해 검색 품질을 높이기 위해 하둡과 NoSQL을 도입했으며, 지난해부터는…