본문 바로가기

[ROUND D 미션] Acculnsight+만 있으면 기계학습을 코딩없이 할 수 있다고?

[ROUND D 미션] Acculnsight+만 있으면 기계학습을 코딩 없이 할 수 있다고?

환영합니다. 이번 ROUND ROUND D입니다.

SK Careers Editor 송유진

 

 

 

 

 

ROUND D의 미션을 공개합니다.

“10분 이내에 데이터 전처리부터 분류 모델 생성 그리고 ROC curve로 성능평가까지…? “

 

 

 

우선, 라이브러리 import부터…. “

데이터 전처리는 오래 걸리니까 ROC plot 생성 코드 먼저!....”

 

 

 

시간이 초과되었습니다.

 

 

 

ROUND D KEY를 획득하기 위해서는 해당 미션을 수행해야만 합니다.
재도전 기회는 1번 더 주어집니다. 재도전 하시겠습니까?

 

 

 

 

AI/Data플랫폼그룹 강기호 매니저님을 찾아 떠나는 챌린져.

 

 

 

안녕하세요. SK C&C에서 근무하고 있는 AI/Data플랫폼그룹 소속 강기호 매니저입니다.

 

 

 

현재 저는 AccuInsight+라는 AI기반 플랫폼을 개발하고 사용자들에게 교육하며 저희 플랫폼을 많은 사람들에게 알리는 업무를 수행하고 있습니다.

 

 

 

AccuInsight+ Accuracy Insight 그리고 플러스의 합성어로서 저희 플랫폼을 사용하는 사람들께 정확한 통찰력 그 이상을 제공하는 것을 목표로 하는 플랫폼입니다. 저희는 이러한 목표를 달성하기 위해 AI 모델을 생성하고 운영하기 위한 전 과정을 지원하고 있습니다.

달리 말하면, AI 모델을 생성하기 위한 데이터 수집, 데이터 처리와 더불어 AI모델을 생성할 수 있는 환경과 이 모델을 API 형태로 접근해 사용할 수 있는 환경, 그리고 배포된 AI 모델 모니터링까지 AI 생애주기 전반을 다루고 있습니다.

 

 

 

코드에 익숙하지 않은 사용자는 딥러닝까지는 할 수 없고 기계학습만 가능합니다.

저희 플랫폼은 UI기반으로 되어 있어 기계학습에 필요한 각 단계를 Drag & Drop한 후에 이를 연결해서 쉽게 기계학습을 진행할 수 있도록 되어 있습니다. 각 단계가 내부적으로는 코드로 되어 있지만 사용자는 이를 알 필요 없으며 UI와 값만 입력하면 쉽게 기계학습이 가능합니다.

그 뿐만 아니라, AutoML 기능을 통해 정제된 데이터만 있다면 기계학습 전 과정을 전혀 알지 못하는 경우라도 가장 적절한 AI 모델과 이를 위한 설정값을 가장 좋은 성능 순서대로 확인할 수 있습니다.

이처럼 Python, R 기반 코드 작성이 익숙하지 않으시거나 비즈니스 데이터 관련 지식이 풍부하시나 코드 작성에 할애할 시간이 많지 않으신 분들이 사용하시면 쉽게 기계학습을 수행하실 수 있습니다.

 

 

 

저희 플랫폼은 에너지, 유통, Healthcare, 금융, 공공 등 다양한 Industry에서 활용되고 있으며 각 Industry에 적합한 노하우를 내부 자산(Professional Asset)으로 가지고 있습니다. 이를 이용하면 각 영역별로 AI관련 비즈니스를 수행하실 때 아무것도 없는 것에서 시작하는 것이 아니기 때문에

더욱 빠르게 목적하는 곳에 도달하실 수 있습니다.

 

 

 

 

 

MCM (Multicloud Cluster Manager)

Q) 클러스터 템플릿 기능을 활용하면 기계학습 알고리즘에 맞는 Cluster를 용도별로 선택할 수 있다고 하는데요, 템플릿 기능에 대해 자세하게 설명해주세요!

 

클라우드 환경에서 하둡 클러스터를 생성하기 위해서는 보안설정, 네트워크 설정, 노드 자원 선택 등 여러 단계를 거쳐야 하는데요, 템플릿 기능은 이 과정을 쉽고 빠르게 하기 위해 사전 설정하는 기능입니다. 템플릿을 활용하면 여러 단계를 거쳐야 하는 과정이 2~3단계로 축소되어 편리합니다. 또한, 용도에 맞게 여러 템플릿을 만들어 놓으면 그 용도에 맞게 쉽게 클러스터를 생성할 수 있어 분석환경을 생성하는데 필요한 시간을 줄일 수 있으며 필요로 하는 환경이 쉽게 제공되어 데이터 처리 및 분석활동도 훨씬 더 쉬워집니다.

예를 들면, SQL 기반 데이터 처리용 클러스터, 교육용 클러스터, 기계학습용 클러스터 등 템플릿을 미리 만들어 놓으면 필요로 하는 클러스터를 골라 쉽게 환경을 생성할 수 있습니다.

 

 

 

Modeler

Q) R/Python 등의 언어에 익숙한 데이터 사이언티스트를 위한 분석 환경도 제공되고 있나요?

 

R/Python 코드 작성에 익숙한 데이터 사이언티스트가 원하는 자원을 자유롭게 할당받아 편리하게 분석활동을 할 수 있는 Sandbox 개념의 개별 분석 환경인 모델러를 제공합니다. 해당 분석환경에서는 필요한 패키지를 자유롭게 설치할 수 있으며 필요할 경우 분석환경을 저장해 다른 사용자에게 공유도 가능합니다. 쉽게 말하면, 초기 분석 환경을 1명만 잘 구성해두면 이를 여러 사용자와 공유할 수 있는 기능입니다.

Python의 경우 JupyterLab 환경도 제공하는데 이를 사용할 경우 필요한 확장기능(Extension)들이 미리 설치되어 있어 사용자들은 좀 더 편리하게 개발하실 수 있습니다. 이외에도 데이터 사이언티스트간 협업과 코드 버전관리를 위한 도구들도 제공하고 있습니다.

최근 트랜드인 딥러닝의 경우 GPU를 사용하면 CPU를 사용하는 것보다 빠른 속도로 모델을 생성할 수 있는데 Modeler를 사용하시면 필요한 환경이 다 설치되어 있습니다. 따라서 사용자들은 GPU가 설치된 서버만 준비하면 바로 딥러닝 코드를 작성하고 모델 생성을 할 수 있습니다. 

 

 

 

저희는 많은 사람들이 AI를 통해 얻고자 하는 비즈니스 목적을 쉽고 빠르게 달성하길 바라고 있습니다. 그래서 전문가 아니더라도 쉽게 AI 모델을 생성할 수 있는 환경을 제공하고 다양한 분석활동을 할 수 있는 Sandbox 등도 제공하고 있습니다.

이러한 목포에 맞게 2021년에는 UX적 측면에서 사용자들이 저희 플랫폼을 좀 더 쉽게 사용하실 수 있도록 변화를 주었습니다. 앞으로도 쉽고 빠르게 다수의 사용자가 AI 모델을 구축하게 지원한다는 저희 목표는 변하지 않을 것이며 이를 위해 끊임없이 발전하고 노력하고자 합니다.

 

 

 

 

 

강기호 매니저와의 인터뷰를 종료합니다.

챌린져님, Acculnsight+와 함께 ROUND D 미션에 다시 도전하시겠습니까?

 

 

 

 

 

챌린져님, 퀘스트를 성공적으로 수행하셨습니다!

Data를 의미하는 D KEY를 획득하신 것을 진심으로 축하드립니다.

ROUND D에서는 SK C&C의 통합 빅데이터 분석 플랫폼 서비스 AccuInsight+에 대해 알아보았습니다.

 

 

 

 

 

다음 ROUND FINAL ROUND입니다. League of Create & Challenge의 마지막 관문 FINAL ROUND에는 과연 어떤 솔루션이 기다리고 있을까요?

챌린져와 함께 FINAL ROUND 도전을 이어 가시겠습니까?