News/SK이노베이션

[직무 인터뷰] 데이터로 이노베이션하다💡 SK이노베이션 Data Scientist 직무 파헤치기!

감노리 2025. 8. 12. 10:00

 [직무 인터뷰] 데이터로 이노베이션하다💡 SK이노베이션 Data Scientist 직무 파헤치기! 

안녕하세요, SK이노베이션 취재기자 오채연입니다.

SK이노베이션은 AI와 디지털 트랜스포메이션(DT)을 통해 끊임없이 혁신을 추구하며, 변화하는 산업 환경 속에서 경쟁력을 강화하고 있습니다. 이는 사내 구성원의 업무 효율성과 의사결정의 정확성을 높이는 데 핵심적인 역할을 하고 있는데요, 이러한 혁신을 실질적으로 이끄는 주인공, 바로 SK이노베이션 DT추진실의 Data Scientist입니다. 👩🏻‍💻

이번 기사에서는 지난해 입사해 활발히 활동 중인 이지윤 PM님을 만나, 조직의 디지털 혁신을 선도하는 Data Scientist 직무의 본질과 의미, 그리고 그 길을 걷기 위한 준비 과정까지 생생하게 들여다보고자 합니다. 데이터를 통해 이노베이션을 창출하는 현장의 이야기, 지금부터 함께 살펴보시죠.

SK Careers Editor 21기 오채연

이지윤 PM: 안녕하세요, SK이노베이션에 지난해 3월에 입사하여 Data Scientist로 재직 중인 이지윤PM입니다. 저는 산업경영공학 박사 학위를 취득했으며, 학위 기간동안 다변량 시계열 데이터 기반 해석 가능 모델 개발을 주제로 연구했습니다. 현재는 SK이노베이션의 디지털 트랜스포메이션(DT) 가속화에 발맞춰, 데이터를 통해 비즈니스 가치를 창출하고 회사 전반의 AI 역량 강화를 돕고 있습니다. 구체적으로는 사내의 정유·화학·에너지 공정의 설비 이상 감지 또는 유가 예측과 같은 시계열 데이터 기반 모델 개발뿐만 아니라, 특정 Task와 관련된 문서를 조회하고, 질의에 대한 답변을 생성하는 생성형 AI 기술 기반 챗봇 개발에도 참여하고 있습니다.

Data Scientist는 기업 내부에 흩어져 있는 방대한 데이터를 활용하여 비즈니스 문제를 정의하고, 이를 해결하기 위해 데이터 기반의 통찰력과 해결책을 제공하는 역할을 수행합니다. 구체적으로는 SK이노베이션 OC 현업 부서의 요구에 따라 문제를 명확히 정의하고, 이에 필요한 데이터를 수집·전처리한 뒤, 통계 분석 및 머신러닝·딥러닝 등 다양한 기법을 적용해 예측 모델을 개발하여 의미 있는 인사이트를 도출하고자 합니다.

특히 저는 시계열 데이터 분석을 전공하여, 정유·화학·에너지 공정에서 설비 이상을 사전에 감지하고 예측하는 업무를 주로 수행하며 공정 안정성과 효율성을 높이는 데 기여하고 있습니다. 최근에는 생성형 AI 기술을 기반으로 사용자 질의에 맞춰 필요한 문서들을 찾아 답변을 생성하는 챗봇 개발에도 참여하고, 업무 효율화와 새로운 가치 창출에도 힘쏟고 있습니다. 이처럼 Data Scientist는 단순히 모델을 개발하는 것에 그치지 않고, 실제 현업에 적용해 비즈니스 성과로 이어지는 것까지 책임지는, 문제 해결의 ‘완결성’을 추구하는 직무입니다.

사실 일과가 정해져 있는 루틴한 업무는 아니에요. 현업에서 분석 수요가 발생하면 이를 프로젝트 단위로 과제를 만들어 진행하는데요. 이때 일반적으로 하나의 프로젝트만 집중하는 게 아니라, 여러 프로젝트를 병렬적으로 수행하게 됩니다. 프로젝트마다 함께 일하는 동료들도 다르고, 투입 인원이나 일정, 과제의 성격도 제각각이라 항상 유동적인 환경에서 일하게 됩니다. 또 각 과제의 진행 단계가 다르다 보니 일이 몰리는 시기도 있고, 비교적 여유가 있는 시기도 존재합니다. 보통 한 명당 평균적으로 3~4개의 프로젝트를 동시에 수행하고 있고, 과제 난이도나 시기에 따라 그 수는 달라지기도 합니다.

이처럼 정형화된 루틴보다는 매번 새로운 문제를 마주하고 해결해야 하는, 도전적이지만 그만큼 흥미로운 직무라고 생각합니다!

학부 시절 산업경영공학을 전공하며 공정관리 및 시스템 효율성에 대해 관심이 있었는데, ‘데이터 분석’ 과목을 수강하면서 이 분야에 깊은 흥미를 갖게 되었습니다. 당시만 해도 지금처럼 데이터 분석을 체계적으로 공부할 수 있는 환경이 잘 갖춰져 있지 않아 원서를 찾아보며 공부해야 했는데요, 이 분야를 더 깊이 공부하고 싶다는 호기심으로 대학원에 진학하게 되었습니다.

대학원에서는 이론적인 학습과 주체적인 연구뿐 아니라 다양한 기업들과의 PoC(Proof of Concept) 프로젝트를 수행하며 실무적인 문제를 직접 경험할 수 있었는데요, 이 과정에서 ‘이론 속 데이터’와 ‘현실의 데이터’ 사이의 큰 간극을 체감하게 되었습니다. 정제되고 완벽한 데이터는 거의 없고, 데이터 수가 적거나 변수 간 관계가 명확하지 않는 등의 다양한 제약을 마주하며 실질적인 문제 해결 능력을 키울 수 있었습니다.

이렇게 실제 현업 문제에서 요구되는 다양한 제약 조건들을 반영하며 예측 모델을 개발하는 과정에서 Data Scientist 직무에 큰 매력을 느꼈고, 실제 산업 현장에서 복잡한 문제들을 풀어보고 싶다는 마음으로 여러 OC의 데이터와 문제를 폭넓게 접할 수 있는 SK이노베이션의 Data Scientist 직무를 선택하게 되었습니다.

복잡하거나 새로운 문제가 발생했을 때 이를 잘 이해하고 창의적인 해결 방안을 구상하는 자체에서도 흥미를 느끼지만, 가장 뿌듯한 순간은 제가 개발한 모델이나 분석 결과가 실제 현업의 의사결정에 긍정적인 영향을 미치고, 궁극적으로 비즈니스 성과로 직결될 때인 것 같아요. 예를 들어, 공정 데이터를 분석하여 비효율적인 부분을 개선하거나, 설비의 고장을 예측하여 손실을 사전에 방지했을 때 말이죠. 특히 SK이노베이션처럼 전통적인 정유·화학 산업에 AI와 DT 기술을 성공적으로 안착시키고, 회사의 미래 성장 동력인 그린 비즈니스 전환에 이바지할 수 있다는 점이 매우 의미 있게 다가오는 것 같아요. 이처럼 제가 만든 결과물이 실제 현장에서 쓰이고, 저의 역량이 회사의 디지털 혁신에 직접적으로 기여하고 있다는 것을 체감할 때 가장 큰 만족감을 느낍니다.

첫 번째는 실제 현업 문제의 비정형성과 데이터 제약, 그리고 공정 배경지식의 부족이었습니다. 학위 과정에서는 정제되고 잘 구성된 데이터를 주로 다뤘지만, 실제 산업 현장에서는 불완전하거나 비정형적인 데이터가 대부분이고, 특히 정유·화학·에너지 공정에서는 공정마다 데이터가 갖는 의미가 달라서 단순히 수치만 보고는 이해하기가 어렵더라고요. 현업에서 당연하게 여기는 용어들이 생소하다 보니, 데이터의 본질적인 의미와 생성 배경을 깊이 이해하기가 쉽지 않았습니다. 따라서 현업 담당자분들과 밀도 있게 의사소통하며 공정 맥락을 이해하고, 제한된 데이터 속에서도 최대한의 가치를 도출하려 노력했습니다.

두 번째는 모델을 실제 현업에 적용하는 과정의 어려움이었습니다. 모델 개발이 끝이라고 생각하기 쉽지만, 실제로는 그 결과가 사용자의 관점에서 어떻게 접하고 활용할지까지 고려해야 하더라고요. 실제 적용 가능한 형태로 구현하기 위해 다양한 부서와의 협업을 중요하게 생각하게 되었고, 이 과정에서 Data Scientist는 기술적인 이해뿐만 아니라, 협업 부서와의 원활한 의사소통 능력이 매우 중요함을 느꼈습니다.

현재 저는 뛰어난 동료들과 함께 업무를 수행하고 있는데요(하하), 동료분들로부터 많은 자극을 받으며 저 역시 안주하지 않고 성장하려 노력하고 있습니다. 빠르게 변화하는 AI 기술을 꾸준히 학습하고, 이를 회사에 신속히 적용하는 역량을 키우는 데 집중할 계획입니다. 새로운 도구와 방법론을 실무에 접목하는 데 주저하지 않고, 학문적인 관점에서도 지속적인 관심을 갖는 ‘배우는 자세를 잃지 않는 회사원’이 되고 싶습니다. 더 나아가, 데이터 분석과 AI 기술을 활용해 기업의 전략적 의사결정과 새로운 성장 동력 창출에 실질적으로 기여하고 싶습니다. 궁극적으로는, 제가 맡은 데이터 기반 문제 해결이 비즈니스뿐 아니라 사회 전반에도 긍정적인 영향을 줄 수 있도록 노력하며, 데이터가 신뢰받고 지속적으로 활용될 수 있는 환경을 만드는 데 기여하고 싶습니다.

Data Science는 단순히 데이터를 해석하고 분석하는 것을 넘어, 주어진 데이터를 기반으로 문제를 정의하고 가설을 수립한 뒤, 그 가설의 타당성을 검증하는 전 과정을 포함하는 분야라고 생각합니다. 즉, 데이터를 수집하고 정제하는 전반적인 과정을 아우르며, 이를 통해 비즈니스와 기술적 의사결정을 최적화하는 데 이바지하는 융합적 학문이자 실무 분야로 자리 잡고 있습니다. 과거에는 자연어 처리나 컴퓨터 비전, 시계열 분석처럼 다루는 데이터의 형태에 따라 세부 분야가 나뉘는 경향이 있었다면, 최근 Data Science는 데이터 분석/비즈니스 인사이트, 머신러닝/딥러닝, 생성형 AI, 데이터/AI 엔지니어링, 데이터 거버넌스 및 윤리 분야까지 포괄하는 등 기능적 특징에 따라 더 다양하고 세분된 방향으로 진화하고 있는 것 같아요.

결국 Data Science는 가설을 세우고 검증하는 과학적 사고를 바탕으로 다양한 데이터 기반 문제 해결을 요구하는 분야이며, 점점 더 복잡해지는 사회와 산업 속에서 그 영향력과 활용 가능성은 계속해서 커지고 있다고 생각합니다.

Data Scientist, Data Analyst, Data Engineer는 모두 데이터를 중심으로 움직이는 직무이지만, 각자의 관점과 역할이 조금씩 다릅니다. 물론 최근에는 직무 간 경계가 점점 희미해지고, 실무에서는 상호 보완적 역량과 협업 능력이 더욱 중요해지고 있는 것 같아요.

먼저 Data Engineer는 데이터가 안정적으로 수집되고 저장되며 처리될 수 있도록, 데이터 파이프라인과 인프라를 구축하고 운영하는 역할을 맡습니다. Data Analyst는 데이터를 바탕으로 비즈니스 현황을 분석하고 필요 인사이트를 도출해 비즈니스 의사결정을 지원하는 직무입니다. 마지막으로 Data Scientist는 분석 기법을 활용해 향후 전망을 예측하거나 필요로 하는 서비스를 개발하는 데에 집중합니다. 인사이트를 제공하는 것을 넘어, 데이터 기반의 자동화된 의사결정 체계나 실행 가능한 솔루션을 만들어내는 데 중점을 둡니다.

네, 문과생도 충분히 Data Scientist 직무에 도전할 수 있다고 생각합니다. 과거에는 수학, 통계, 컴퓨터공학 등 이과적 배경이 필수라는 인식이 강했지만, 최근에는 도메인 지식과 문제 해결 능력의 중요성이 강조되면서 문과생들에게도 기회가 넓어지고 있습니다. 실제로 경영대나 인문계열 소속으로 활발히 연구하고 활동하는 전문가들이 많아졌고, 데이터 사이언스가 특정 전공에 국한된 분야가 아니라는 인식이 점점 확대되고 있습니다.

또한 요즘은 데이터 분석에 필요한 수학적·기술적 지식을 쉽게 배울 수 있는 자료가 정말 많아졌고, 생성형 AI의 보급으로 코딩 진입 장벽도 많이 낮아졌기 때문에 ‘기술을 잘 모른다’라는 이유만으로 도전을 망설일 필요는 없습니다. 오히려 문과생들이 문제를 더 직관적으로 바라보며, 분석 결과를 효과적으로 전달하고 현업의 요구에 공감하며 설득력 있게 소통하는 데 강점이 있을 수 있다고 생각해요. 결국 중요한 것은 전공 자체보다도, 열정적으로 배우려는 태도와 문제 해결에 몰입하는 자세, 다양한 실전 경험을 쌓아가는 과정인 것 같습니다.

과거에는 Data Scientist 직무에 필요한 핵심 역량으로 고급 통계 및 머신러닝 모델에 대한 깊은 이해, 그리고 복잡한 코딩 기술이 강조되었고, 이를 체계적으로 학습하기 위해 대학원 진학이 선호되었던 것이 사실입니다. 그러나 최근에는 생성형 AI 기술의 발전과 자동화 도구의 등장으로 기술적인 진입 장벽이 상당히 낮아졌습니다.

이제는 Data Scientist에게 요구되는 진짜 경쟁력은 현실의 문제를 기획하고, 관련 데이터를 탐색하며, 적절한 모델을 선정하여 적용한 뒤 그 결과를 실제 비즈니스에 반영해 보는 일련의 완결된 문제 해결 경험이라고 생각합니다. 이러한 경험은 대학원에서의 연구나 프로젝트 수행 등을 통해 기를 수도 있지만, 꼭 대학원이 아니더라도 인턴십, 공모전, 스터디 등 실무와 가까운 다양한 경험을 통해서도 충분히 쌓을 수 있다고 생각합니다. 결국 중요한 것은 학위 그 자체보다는 ‘실제 문제를 주도적으로 해결해 본 경험’과 ‘그 과정을 포트폴리오로 잘 정리해 내는 능력’이라고 생각합니다.

먼저, 기초 역량을 다지는 게 중요합니다. 선형 대수, 확률과 통계, 미적분 같은 수학적 기초를 탄탄히 해두는 것이 필요하고요. Python과 같은 언어로 데이터를 다루는 기본적인 코딩 능력도 함께 갖춰야 합니다.

그다음은 이론 학습과 실습의 병행입니다. 머신러닝이나 딥러닝, 시계열 분석처럼 데이터 과학의 주요 알고리즘에 대한 이론적 이해를 쌓는 동시에, 실습을 병행하는 것이 중요합니다. 직접 구현해 보면서 이론을 체화하는 과정이 실력을 키우는 데 큰 도움이 되었습니다.

마지막으로, 실전 프로젝트 경험을 쌓는 것이 중요합니다. 저와 같이 대학원을 진학해 다양한 학술활동 및 기업 프로젝트에 참여하는 것이 아니더라도 해커톤 또는 공모전 등을 통해 이론을 실제 문제에 적용하는 연습을 하는 것을 추천합니다. 결국 중요한 건, 문제 정의부터 해석까지 ‘완결적으로 풀어본 경험’을 통해 실질적인 역량을 증명해 내는 것이라고 생각해요.

이 직무에서 가장 중요한 역량은 문제를 정의하고 해결하는 능력그 전 과정을 스스로 끝까지 수행해 본 경험이라고 생각합니다. 최근 생성형 AI 등의 발전으로 기술적 진입장벽은 점점 낮아지고 있는 만큼, 기술적 역량만으로는 차별화되기 어렵습니다. 오히려 중요한 건 복잡한 비즈니스 문제를 어떻게 정의하고, 어떤 가설을 세워 어떤 데이터와 모델링 기법으로 접근했으며, 그 결과를 비즈니스 관점에서 해석하고 설득해 본 전 과정을 주도한 경험입니다. 저 역시 대학원 진학과정에서 다양한 기업의 프로젝트에 참여하며 이러한 실전 경험을 쌓았고, 이러한 경험이 저의 실력을 가장 실질적으로 증명해 주는 밑바탕이 되었다고 생각합니다.

Data Scientist는 비즈니스 문제를 데이터 기반으로 정의하고 창의적으로 해결해 새로운 가치를 창출하는 역량이 핵심인 직무입니다. 최근에는 온라인 강의나 오픈소스 자료 등을 통해 학문적인 접근이 쉬워졌고, 생성형 AI와 같은 도구의 등장으로 분석에 대한 기술적인 장벽 또한 낮아지며 이제는 깊이 있는 도메인 지식, 창의적인 문제 해결 능력, 그리고 전 과정을 끝까지 완수하는 끈기가 더욱 중요해지고 있습니다. 교과서적인 지식에 머무르기보다는 공모전, 인턴십 등을 통해 현장의 복잡하고 비정형적인 문제에 직접 부딪쳐 보시길 추천합니다. 실패도 많이 겪어보시고, 그 과정에서 여러분이 어떤 문제를 어떻게 해결했는지, 어떤 가치를 만들어냈는지를 중심으로 자신만의 스토리를 꼭 만들어 보세요. AI와 DT로 혁신을 추구하는 SK이노베이션 같은 곳에서 여러분의 Data Science 역량이 마음껏 발휘되기를, 진심으로 응원합니다!


지금까지 SK이노베이션 DT추진실의 이지윤 PM님과 함께 Data Scientist 직무의 다양한 면모를 살펴보았습니다! 단순 기술적 역량뿐만 아니라, 창의적인 문제 해결 능력과 원활한 의사소통 능력 등, ‘코딩 기술자’라는 말로는 결코 다 표현할 수 없는 직무임을 깊이 체감할 수 있었던 시간이었습니다.

인터뷰에 응해주신 이지윤 PM님께 진심 어린 감사 인사를 전하며, 강조하셨던 ‘문제해결의 완결성’과 ‘끊임없는 학습과 도전’의 메시지가 Data Scientist를 꿈꾸는 여러분께도 큰 힘이 되길 바랍니다.

마지막으로, 바쁜 여러분들을 위해 준비한 세줄 요약과 함께 마무리하고자 합니다. 다음번에도 유익하고 알찬 기사로 찾아뵙겠습니다! 지금까지 SK이노베이션 취재기자 오채연이었습니다 😊