딜라이트닷넷

빅데이터 위한 데이터 사이언티스트 양성, 어떻게 접근해야?

IT만담 12.12.11 09:10

사용자 삽입 이미지
빅데이터가 주요 기업의 관심사로 떠오르며 이를 효과적으로 활용할 수 있는 데이터 사이언티스트(데이터 과학자) 양성이 주요한 화두가 되고 있다. 하지만 그 양성 방법에 대해선 업계간 의견이 엇갈리고 있어 주목된다.

전 세계적으로 데이터 사이언티스트 양성은 기업뿐만 아니라 국가적인 과제로 등극하고 있다.

미국이 ‘빅데이터 R&D 이니셔티브’를 통해 빅데이터 분석에 대한 체계 수립에 나섰으며 싱가포르의 데이터 사이언티스트 양성 계획, 그리고 우리나라 정부도 데이터 사이언티스트 양성을 위한 정책을 수립하는 등 발 빠르게 나서고 있는 것.

그렇다면 기업의 경우 데이터 사이언티스트 양성에 어떻게 접근해야 할 까? 사실 기업의 경우 마케팅 부서나 경영 파트에서 비즈니스 인텔리전스(BI)나 데이터웨어하우스(DW)에 기반한 분석작업은 꾸준히 있어 왔다.

특히 IT부서에서 전담하던 분석 작업을 이제는 현업에서 수행하고 있다는 점은 의미가 깊다. 하지만 빅데이터 분석의 경우는 얘기가 다르다.

기업의 레거시 시스템에서 정보를 불러와 분석을 하던 기존 분석과 달리 빅데이터 분석은 외부 정보는 물론 내부에 의미 없는 정보로 분류됐던 것 까지 창조적으로 분석할 수 있는 능력이 필요하다.

업무 분야에 대한 지식은 물론 통찰력과 창조력이 더해져야 빅데이터 분석을 효과적으로 할 수 있다는 뜻이다.

하지만 기업 입장에서 빅데이터 분석을 위해 별도의 데이터 사이언티스트를 고용하는 것은 부담이 될 수밖에 없다. 대부분의 기업은 기존 인력을 ‘교육’시켜 데이터 사이언티스트를 양성하는 것에 초점을 맞추고 있다.

BI업체인 아크플란의 올리버 데이슬러(Oliver Deistler) 부사장은 이에 대해 “실질적으로 데이터 사이언티스트가 앤드 유저 중심이 돼야하는 것은 중요하다”고 지적했다.

는 “현재 기업 사용자의 28-30% 정도가 빅데이터 분석을 위한 정보에 접근이 가능한 수준”이라며 “나머지 사람들도 의미 있는 정보를 제공하는 주체이기 때문에(서로 다른 디바이스, PC, 모바일 디바이스, 태블릿) 앤드유저 중심의 데이터사이언티스트 양성이 필요하다”고 말했다.

마이크로스트레티지의 쿠치펭(Ku Chih Feng) 아태지역 세일즈 엔지니어링 담당도 “DW분석자가 데이터 사이언티스트로 발전하는 것은 자연스럽고 논리적이다”라고 말한다.

그는 “기본적으로 데이터를 다루는 경험이 있는 사람이 데이터 마이닝 및 트렌드를 예측할 수 있을 것”이라며 “DW분석자를 트레이닝 시켜서 레벨 업을 시키는 것이 필요할 것”이라고 밝혔다.

그렇다면 현업과 IT부서 담당자 중 누가 데이터 사이언티스트가 돼야 할 까? 이에 대해 쿠치펭 담당은 “현업에서는 데이터의 성격을 알지만 IT부서의 경우 통계나 수학은 알지만 데이터의 가치는 모르는 경우가 많다”며 “따라서 두 부서의 의견 균형을 맞추는 것이 중요하다. 그러나 과학자는 의사결정자는 될 수 없다”고 강조했다.

하지만 빅데이터 분석을 기업 내부에서 하는 것은 한계가 있다는 지적도 있다.

최근 빅데이터 분석 플랫폼을 선보인 LG CNS 박용익 고급분석(AA) 센터장은 “빅데이터 분석을 기업 자체에서 한다는 것은 한계가 있다”며 “전문 업체에 외주를 주는 것이 오히려 효율적”이라고 주장했다.

데이터 사이언티스트를 양성하기 위한 기반 지식과 인프라가 기업에는 부족하다는 것.특히 빅데이터 분석은 분석을 위한 솔루션에 대한 지식 등이 필요하므로 이에 대한 경험이 없는 기업 내부자가 분석업무를 진행하는 것은 한계가 있다는 지적이다.

빅데이터가 국내시장에서 초기 단계에 접어 든 만큼 이를 활용하기 위한 데이터 사이언티스트 양성도 첫걸음을 내딛고 있는 상황이다.

기업에서도 자체 인력 양성, 혹은 외주를 통한 데이터 사이언티스트 활용 등 다양한 방법을 고민해야할 시점이 왔다. 단 외주를 통한 데이터 사이언티스트 이용의 경우 민감한 기업 내부 정보를 외부에 맡길 수 있느냐가 관건이 될 것으로 보인다.

그동안 국내 시장에서 클라우드 컴퓨팅이 기업 시장에 빠르게 전파되지 못한 이유가 바로 이러한 자신들의 정보를 외부에서 관리해준다는 것에 대한 거부감이었기 때문이다.

다만 최근 이러한 기업의 인식이 많이 개선되고 있어 클라우드 컴퓨팅의 확산이 기대되고 있다. 마찬가지로 데이터 사이언티스트의 양성과 그 활용에 있어서 직접 양성과 함께 아웃소싱을 검토하는 것이 기업의 숙제가 될 것으로 전망된다.