본문 바로가기

을지로 데이터 천국, SK텔레콤 DT센터

을지로 데이터 천국, SK텔레콤 DT센터


을지로에 구글 못지 않은 데이터 천국이 있다고 해서 찾아가 보았는데… 그곳은 바로 SK텔레콤? 국내 최고 수준의 데이터를 보유하고 있다고 알려진 SK텔레콤의 DT센터. 그 안에서는 어떤 일이 펼쳐지고 있을까? 


SK Careers Editor 류정인



 안녕하세요. 저는 DT센터에서 데이터 분석을 하고 있는 오승모입니다.



DT센터는 SK텔레콤 내의 전사 데이터 조직이에요. 전사 데이터 조직은 현재 AI센터와 DT센터가 있습니다. 저희 DT센터에서는 SK텔레콤 데이터 뿐 아니라, SK그룹 ICT 패밀리(SK그룹 내의 주요 ICT 관계사)의 다양한 데이터까지 종합해서 보고 있습니다. 

 


아무래도 오랜 기간 동안 축적된 데이터가 많고요. 회사 자체적으로 데이터를 활용하려는 의지가 굉장히 강해요. 그래서 데이터를 모으는 것부터 체계적으로 잘 되어있다 보니, 데이터의 질 또한 정말 좋다는 점에서 최고 수준의 데이터를 보유했다고 말할 수 있는 것 같아요. 데이터를 아무 생각 없이 모으다 보면, 나중에 어떻게 활용해야 할지도 모르고, 뭘 의미하는지도 모르는 경우가 엄청 많아요. SK텔레콤 같은 경우는 데이터에 대한 활용 의지가 높았기 때문에, 데이터 분석의 전문가들을 많이 데려왔어요. 그래서 그 분들이 데이터 수집부터 하나하나 체계를 만들어 나갔기 때문에, 다른 곳에 비해서 의미 없는 데이터의 비율이 훨씬 적은 것 같아요. 흔히 데이터가 ‘깨끗하다’고 표현하죠.

 


일단 저처럼 데이터 분석을 하시는 분들이 있는데, 개발자분들이 입수하고 처리해주신 데이터들을 분석하면서 인사이트를 도출하거나 문제해결 방법을 찾는 역할을 하고 있습니다. 


또, DT센터에도 기획자와 개발자 분들이 있어요. 기획자분들은 기본적으로 다른 분야의 기획자분들이 하시는 업무를 비슷하게 하면서도, 어느 정도 데이터 분석을 할 수 있는 분들이에요. 데이터 분석을 배우고 스스로 공부하시기도 하고요. 그래서 구체적으로 데이터 분석 방향을 설정해주시는 분들도 계시고, 어떤 곳에 데이터를 활용하려고 할 때, 그에 맞는 데이터 분석을 해달라고 하시는 분도 계시죠. 제가 봤을 때는 DT센터에서 근무하시는 기획자분들은 다른 기획자분들에 비해 데이터를 보는 눈이 훨씬 좋으신 것 같아요.


그리고 개발자분들은 저희가 데이터를 분석할 수 있는 최적의 환경을 만들어 주세요. 요즘은 분석하려면 서버가 기반이 되어있어야 해서, 분석에 필요한 서버 운영과 관리를 해주시죠. 데이터 입수부터, 기본적인 전처리도 다 해주시고요. 또, 저희가 분석한 것을 바탕으로 서비스화를 하시기도 하고요. 없어서는 안 되는 분들입니다! 분석 외에 데이터에서 필요한 모든 일을 한다고 보시면 될 것 같아요.

 


일반적으로 고객에게 맞춤형 상품을 추천하는 타겟 오퍼링에 많이 활용되고 있습니다. 그리고 고객이 상담센터로 전화한 의도를 미리 예측해서 보이는 ARS를 통해 개인화 메뉴를 제공하기도 하고, 통화 품질이 좋지 않아 불편을 겪는 고객을 먼저 예측해서 사전적으로 조치하기도 합니다. Oksusu의 사용자 맞춤 콘텐츠 추천과 AI 스피커 NUGU의 서비스 품질 개선을 위해서도 데이터 분석이 많이 사용되고 있어요.


 

우선 분석할 데이터를 찾아야겠죠? 조사된 데이터를 받아서 여러 각도에서 데이터를 뜯어보기도 하고, 잘못된 데이터, 의미 없는 데이터는 제외시키는 작업을 먼저 해요. 보통 이 전처리 과정이 제일 긴데, 분석을 할 수 있도록 데이터를 가공하는 거예요. 그러고나서 분석가가 직접 분석 방향을 정하고 어떤 분석방법을 적용해서 데이터들을 분석할 것인지 결정하죠. 크게 나누면 수집된 데이터를 바탕으로 미래 상황을 예측하기 위해 예측모형을 만들어서 예측력을 높이는 것이 목적인 분석이 있고요. 인사이트 도출이 목적인 경우에는 분석할 때에 어느 정도 그리고 있는 그림(가설)이 있기 때문에, 가설이 부합하는지를 확인하기 위해서 분석을 사용해요. 그리고 이 데이터 분석 결과들을 적용해서 프로모션이나 서비스를 진행하는 것이죠. 


 


사실 기존에 했던 데이터 분석들과 비교했을 때, 빅데이터 분석이라고 해서 크게 달라진 것은 없는 것 같아요. 데이터 분석은 예전부터 있었던 것이지만, 아무래도 정보의 양이 커져서 빅데이터라는 말을 쓰는 것 같은데, 컴퓨팅 기술이 고도화되면서 데이터 처리 기술도 훨씬 많아졌어요. 그에 따라 분석 방법도 다양해졌다는 것이 기존 데이터 분석과 가장 큰 차이라고 할 수 있을 것 같습니다. 그래서 데이터 분석가들은 데이터를 보고 어떠한 분석방법을 적용해야 할지를 잘 선택해야하죠. 또, 기존에 비해 다룰 수 있는 데이터 영역이 넓어졌다는 것도 기존과 다른 점인 것 같아요. 데이터의 종류나 관련 산업분야도 훨씬 많아졌으니까요. 이 때문에 빅데이터 분석가 입장에서는 분석 방법과 더불어 도메인 지식도 더욱 중요해진 것 같아요.


 

제가 통계학을 전공했는데, 통계학은 말 그대로 학문이에요. 데이터 분석의 기반이 되는 학문이긴 하지만 직접적으로 활용되기는 정말 어려워요. 실생활에 존재하는 데이터들이 그 수학적인 이론에 딱 부합하는 것들이 아니기 때문이죠. 그런데 기본적으로 데이터 분석에 활용되는 기법들이 다 통계학에서 나온 것이라서, 새로운 기법들을 만들거나 공부할 때에는 무조건 통계학을 알아야 해요. 쉽게 말해서, 분석하는 기술을 만드는 학문인 것이죠. 그런데 통계학 자체만으로는 실제적인 분석이 어렵고요. 


데이터를 크게 볼 때는 안 보이는 것들이 있어요. 그러한 데이터들을 정밀하게 나눠보기도 하고, 여러 분석방법이나 모델링을 적용해보기도 하면서 그 데이터의 실질적인 의미가 나올 때까지 분석을 해보는 것이 데이터 분석이죠.

 


일반적으로 산업공학을 전공한 분석가들은 우선 코딩과 분석 기술에 능하고, 통계학을 전공한 분석가들은 이론에 강하다고 생각을 많이 해요. 아무래도 교과 과정에서 차이가 나기 때문에 이러한 경향이 있을 수도 있겠죠. 그래서 산업공학과나 컴퓨터공학을 전공하신 분들이 예측 모델링 분석 속도에서 강세를 보이기도 해요. 그런데 그 분석이라는 것이 예측모형모델링 등의 예측력을 높이는 것이 중요할 때도 있지만, 인사이트를 뽑아내거나 정성적인 부분에서는 응용통계학 전공자 혹은 인문계 출신들이 강세를 보이는 경우도 많죠. 그래서 저는 둘 다 필요한 부분이라고 생각해요. 그런데 아무래도 갈수록 데이터도 더 빨리, 많이 들어오고, 분석할 것도 많아지는 상황이에요. 그렇다 보니 그 데이터들을 빠르고 능숙하게 처리할 수 있는 공학계열 전공자들이 점점 더 많아지는 것 같습니다. 

 


일정한 루틴이 정해져 있지는 않지만, 저 같은 경우는 아침에 구글 캘린더로 공유된 일정을 보면서 제가 들어갈 회의를 확인하고요. 회의가 없다면 그 시간에 각자 어떤 일을 할지 정하고, 개인적으로 일을 해요. 거의 각각의 프로젝트로 일이 진행되는데, 마감 기한에 맞춰서 자기가 유동적으로 분석 스케줄을 짜는 식이죠. 특별히 프로젝트가 없는 경우에는 DT센터에 데이터가 워낙 많으니까, 프로젝트를 스스로 기획해서 해보기도 하고요. 분석가라고해서 분석만 하는 것이 아니라, 기획을 겸하는 경우도 있답니다.

 


상담사 분들이 업무에 활용하실 수 있도록, 데이터 분석을 통해 운영되는 모델을 만드는 프로젝트가 있었어요. 운영이라고 하면, 계속해서 들어오는 데이터들에 맞게 모델이 업데이트되어야 하거든요. 근데 이걸 자동화할 때 사용하는 프로그램이 제가 다루던 것과 다르고 언어도 달라서, 처음에 고생을 굉장히 많이 했죠. 회사가 아닌 학교에서는 이런 업무를 할 일이 없었거든요. 혼자 공부도 하고, 선배님들도 많이 도와주셔서 잘 할 수 있게 된 프로젝트가 가장 기억에 남네요.

 


저도 입사한지 얼마 안 돼서 많은 데이터들을 다뤄보지는 않았는데, 제 입장에서는 학교에서 다뤄보지 않은 데이터들이 제일 까다로운 것 같아요. 특히 텍스트 데이터 같은 경우에는 오타나 줄임말도 많고, 신조어도 많다 보니 데이터가 잘 정제되어 있지 않아요. 아무래도 이렇게 정제하기 힘들고 정제되지 않은 데이터들, 완전히 날 것의 데이터를 다루기가 제일 어렵습니다. 처리하는데 시간도 오래 걸리고요.



제 생각에는 앞으로 빅데이터 산업은 더욱 커질 것 같아요. 사실 데이터 분석은 AI나 빅데이터라는 말이 등장하기 이전부터 계속 있었던 일이에요. 저는 기술의 발전에 의해 많은 양의 데이터 수집과 분석이 가능해지면서 빅데이터라는 산업 트렌드가 생긴 것이라고 보고 있어요. 아마 기술의 발전은 앞으로 더 빨라질 거예요. 그만큼 데이터를 분석할 수 있는 능력과 속도는 계속 증가할 것이기 때문에 앞으로도 데이터 분석이 사용될 수 있는 영역은 넓어질 것이라고 생각합니다. SK텔레콤에서도 DT센터는 원래 텔레콤 내의 데이터만, 즉 통신 위주의 데이터를 분석했어요. 그런데 이제 SK그룹 내의 다양한 서비스들이 보유한 데이터까지 분석하게 되면서 새로운 인사이트를 도출하고, 새로운 사업을 발굴해내는 중이기도 하죠.

 


처음부터 데이터에 관심을 가지고 있었던 건 아니었는데, 통계학과에 진학해서 공부를 하다 보니까 데이터가 재미있더라고요. 통계에는 사람의 주관이 거의 안 들어가잖아요? 숫자를 넣어서 결과가 나오면 통계학에서는 그게 정답이기 때문에 받아들여야 해요. 그것을 통해 객관적으로 의사결정을 할 수 있다는 점이 굉장히 매력적이었어요.

 


저는 코딩이 제 약점이라고 생각했어요. 그래서 코딩 실력을 늘리고자 친구들과 함께 데이터 분석 공모전을 나갔죠. 학교에서 과제로 주는 데이터들은 엄청 잘 정제되어 있어서, 말 그대로 ‘교육용’ 이에요. 그래서 공모전을 통해 실제 데이터들은 어떤지 보고, 그것들을 분석해보는 경험을 늘리고 싶었어요. 또, 데이터를 직접 수집해서 분석하고, 그 결과를 어떻게 사업화를 시킬 수 있을지 고민해서 개발을 할 줄 아는 친구들과 함께 웹페이지나 어플을 서비스화 해보기도 했어요. 그러니까 데이터 분석은 당연히 중요하고, 데이터를 활용해서 할 수 있는 여러 가지 활동들을 많이 해보는 것도 중요하다고 생각해요. 또 그 경험을 바탕으로 포트폴리오를 정리해두는 것이 나중에 큰 도움이 된답니다. 



아무래도 대부분 코딩이나 분석기법에 대해서 잘 알아야한다고 생각하는데, 그런 것들은 회사 들어와서 자연스럽게 배울 수 있다고 생각해요. 그런데 기본적으로 데이터 분석에서는 본인이 문제를 정의하고 해결할 수 있는 능력이 있어야 하거든요. 분석을 하다보면 여러 가지 문제가 엄청 많아요. 데이터가 이상하거나, 필요한 데이터가 없을 때도 있고요. 그럴 때 이 문제를 어떻게 해결할지 고민하는 상황이 분석하는 일보다 훨씬 많아요. 이게 굉장히 추상적인 것이긴 한데...(웃음) 결국 기본적인 문제해결 능력이 제일 중요하다고 생각해요. 어느 회사나, 직군에서도 마찬가지겠지만요. 또 배경지식이 많이 있을수록 좋아요. 트렌드도 잘 알아야하고요. 만약 20대들의 관심사를 분석했는데, 요즘 20대들의 트렌드를 모른다면 그 결과를 이해할 수가 없을 거예요. 분석이 잘 된 것인지 아닌지도 구별하기 어렵겠죠.

 


저는 사실 딥러닝, AI 이런 것들에 대해서 거의 모르고 들어왔어요. 코딩도 잘 못하고요. 부족한 점이 많았는데, 저는 데이터와 관련해서 활동도 많이 했고, 기획이나 마케팅 쪽도 공부를 많이 했었어요. 그래서 저는 분석 능력보다는 분석 경험뿐만 아니라 다른 분야의 경험 또한 많다는 것을 많이 내세웠어요. 본인이 다른 사람보다 잘 할 수 있는 것이 분명히 있을 테니, 본인만의 장점을 잘 살린다면 다른 부분이 조금 부족하더라도 충분히 자신의 가치를 보여줄 수 있을 것이라고 생각해요. 자신이 코딩을 너무 모른다고, 분석 기술을 잘 모른다고 해서 좌절할 필요는 하나도 없어요. 또 그것만 잘하고 다른 부분에서는 부족한 사람도 있어서, 그 부분을 채워줄 사람이 필요하니까요. 회사는 다양한 사람들이 있을수록 좋기 때문에, 자기가 잘하는 영역을 어필하면 충분히 좋은 결과가 있으리라 생각합니다.


 

지금까지 오승모 담당자님과 함께 데이터 분석과 DT센터에 대해서 알아보았습니다. 담당자님의 세심하고도 친절한 설명들을 들으니 데이터 정복 욕구가 뿜뿜!하지 않나요? 데이터에 대해 하나도 몰랐던 데린이 에디터도, 인터뷰를 통해 데이터 분석에 대해 알게 된 것 같습니다. 날이 갈수록 그 가능성이 확장되고 있는 데이터 산업! 쉽게 지나치기 쉬운 작은 숫자들이 모여 인사이트가 되고, 우리 일상 곳곳에 스며들어 있다는 사실이 매우 놀랍습니다. SK텔레콤의 데이터 분석으로 계속해서 탄생할 새로운 서비스들을 기대합니다.