본문 바로가기

[T-TIME☕] 실험과 코드로 내일을 설계하다 ⚙ SKT AI R&D 개발자 이야기

[T-TIME☕] 실험과 코드로 내일을 설계하다 ⚙ SKT AI R&D 개발자 이야기

안녕하세요. SK텔레콤 취재기자 김민서입니다. 🎤

AI 기술이 눈부시게 발전하는 지금, 그 속엔 수많은 실험과 고민을 거듭해온 개발자들의 시간이 켜켜이 쌓여 있습니다. 이번 [T-TIME☕]에서는 그 여정을 함께해 온 두 명의 SK텔레콤 AI R&D 개발자를 만나 이야기를 나눴습니다.

단순한 성능 향상을 넘어, ‘진짜 도움이 되는 AI’란 무엇인지 끊임없이 묻고 답하는 사람들. 
그들의 실험과 협업, 몰입의 과정을 지금부터 함께 들여다보시죠!

SK Careers Editor 21기 김민서

현정님: 안녕하세요. SK텔레콤 AI R&D 센터 BioMedical AI 개발팀에서 근무 중인 입사 3년 차 개발자 강현정입니다.

재경님: 안녕하세요. SK텔레콤 AI Model lab, Model Alignment팀 소속으로 올해로 3년 차를 맞은 개발자 조재경입니다.

현정님: BioMedical AI 개발팀은 딥러닝 기반의 진단, 예측, 건강 모니터링 기술을 통해 의료진과 환자 모두에게 더 나은 의료 경험을 제공하는 솔루션을 연구하고 개발하는 조직이에요. 그중 저는 반려동물 진단 보조 서비스인 ‘X-Caliber’ 프로젝트에서, 개의 근골격계 질환을 진단하는 AI 모델을 개발하고 있습니다. 의료 데이터를 바탕으로 질환을 사전에 예측하거나 판독할 수 있도록 모델을 고도화하고 있으며, 실제 진료 현장에서 신뢰도 높은 보조 수단이 될 수 있도록 다양한 측면에서 모델을 개선해가고 있습니다.

재경님: SK텔레콤 고유의 LLM 'A.X'의 개발과 고도화를 맡고 있습니다. LLM 개발은 대규모 데이터를 기반으로 언어 능력을 학습시키는 pre-training과, 사용자와의 상호작용을 통해 응답의 질을 개선하는 post-training으로 나뉘는데요. 저는 이 중에서 post-training을 담당하고 있으며, 다양한 유즈케이스에서 수집한 로그와 피드백을 바탕으로 모델 성능을 정제하는 작업도 함께 진행하고 있습니다.

현정님: X-Caliber는 현재 국내외 여러 동물병원에서 사용 중이며, 기존 모델의 유지와 새로운 서비스 확장이 동시에 이뤄지고 있어요. 제가 담당하는 개 근골격계 진단 모델은 2022년 출시와 함께 처음 적용된 이후 다양한 고객 피드백이 누적되어 있는 상황이에요. 현장의 요구 중 시급하거나 필수적인 항목을 중심으로 사업팀, 개발팀, 자문 수의사가 협의해 우선순위를 정하고, 개발이 적합한 질환인지, 학습에 필요한 데이터를 확보할 수 있는지를 함께 검토합니다. 또한, 의료 서비스 특성상 모든 과정에서 자문 수의사와 긴밀히 협업하며, 임상적 타당성과 정확도를 지속적으로 확인하고 있습니다.

재경님: LLM의 post-training 업무는 약 1~2개월 단위로 반복됩니다. 먼저 성능 개선이 필요한 도메인을 선정해 평가 벤치마크를 구축하고, 그에 맞는 학습 알고리즘을 결정해 구현합니다. 이후 기존 데이터를 정제하거나 필요한 데이터를 추가해 학습 환경을 구성하고, GPU 리소스를 고려해 실험 계획을 세웁니다. 실험이 완료되면 다양한 유즈케이스에서 수집한 로그와 피드백을 기반으로 성능을 평가하고, 가장 우수한 모델을 선정해 릴리즈하는 구조입니다.

 

현정님: 기억에 남는 건 데이터 정제 작업이에요. 데이터 수가 적은 데다 사람이 직접 작업하다 보니 휴먼 에러가 자주 발생했어요. 이를 줄이기 위해 자체 어노테이션 툴을 개발하고, 작업 기준이 달라지지 않도록 가이드라인도 보완했죠. 포맷이 다른 데이터를 통합해 안정적으로 관리할 수 있도록 파이프라인도 구축했습니다.

두 번째로는 고객의 사용 방식과 개발자의 관점 차이였어요. 학습 데이터와 전혀 다른 분포의 영상이 들어오는 경우가 있었는데요. 단순히 분포 차이를 줄이기보다는, 그런 요청이 왜 발생했는지를 분석했고, 결국 기존 아키텍처가 현장 워크플로우와 맞지 않는다는 걸 알게 되었어요. 이후 전처리 모듈을 새로 설계하고 아키텍처를 조정하며 문제를 해결했습니다

재경님: 첫 번째는 부족한 GPU 자원에서 실험 효율을 높이는 일이었습니다. 내부에 맞는 방식으로 알고리즘을 개선하고, 연산량을 줄이며 분산처리를 최적화했어요. 라이브러리까지 직접 수정해 기존보다 2~3배 빠른 학습 속도를 달성할 수 있었습니다.

두 번째는 LLM 평가 체계 통합이었어요. 결과가 팀원마다 달라지는 문제를 해결하기 위해, 다양한 평가 수치를 하나의 파이프라인에 묶고 자동화 시스템을 구축했어요. 여기에 GUI 기반 협업 도구도 더해져 평가 일관성과 효율이 모두 높아졌습니다.

현정님: 몰입을 유지할 수 있었던 가장 큰 원동력은 팀원들이라고 생각해요. 진부하게 들릴 수도 있지만, 개발에 몰입할 수 있는 환경이 얼마나 중요한지 직접 업무를 해보며 체감하게 됐어요. X-Caliber는 상용 서비스이기 때문에 다양한 이해관계가 얽혀 있고, 개발과는 다른 성격의 일도 많아요. 개발이 저격수처럼 목표에만 집중해야 하는 일이라면, 프로젝트 조율은 사령관처럼 넓은 시야가 필요한 일이죠.
하지만 저희 팀은 R&R이 명확하게 나뉘어 있어서, 저는 모델 개발에만 집중할 수 있는 환경에서 일하고 있어요. 덕분에 실험과 개선에 몰입할 수 있었고요. 팀장님이 적절한 기회를 발굴해주시고, 임원분들이 오래도록 믿고 지원해주신 것도 큰 힘이 됐습니다.
 
재경님: 저는 지금 AI 기술이 세상을 빠르게 바꾸고 있다는 걸 매일 체감하고 있어요. 역사가 변곡점을 지나는 이 시기에, 아주 작더라도 그 흐름에 기여하고 있다는 사실 자체가 원동력이 돼요. 누구도 가보지 않은 길을 직접 경험할 수 있다는 점도 흥미롭고요. 특히 LLM은 지금 AI 산업에서 가장 주목받는 분야잖아요. 매일 새로운 도전을 맞이하면서도, 이 여정이 단순한 업무를 넘어 의미 있는 경험이라는 생각이 들어요. 이런 감정이 반복적인 실험 속에서도 재미를 느끼게 해주는 것 같아요.

현정님: 제가 가장 중요하게 생각하는 건 모델의 ‘효용 가치’예요. 아무리 성능이 뛰어나더라도, 실제 서비스 환경에서 도움이 되지 않는다면 그건 좋은 AI라고 보기 어렵거든요. 예를 들어 뇌출혈을 99% 정확도로 탐지하는 모델이 있다고 해도, 진단 결과를 기다릴 시간이 없는 상황이라면 현실에선 사용되기 힘들겠죠.

반면, 반복적인 작업을 10에서 2~3 정도로 줄여주는 모델은 정확도가 다소 낮더라도 사람들이 기꺼이 사용하는 경우도 많아요. 실제로 그런 AI들이 상용화도 잘 되고 있고요. 그래서 어떤 모델이 사람들에게 실질적인 가치를 줄 수 있을지를 항상 염두에 두고 개발에 임하고 있습니다.

재경님: 저도 실사용성이 가장 중요하다고 생각해요. 개발자 입장에서는 벤치마크 점수에 쉽게 매몰되기 쉬운데, 실제로는 숫자보다 사람이 어떻게 느끼는지가 훨씬 중요할 때가 많거든요. 예를 들어 99점짜리 모델이 반말로 답변해서 불편함을 주는 경우, 오히려 95점짜리 모델이 더 나은 선택이 되기도 해요.

그래서 항상 숫자만 보는 게 아니라, 모델이 실제로 어떤 식으로 답하는지 정성적으로 체크하려고 해요. 응답의 말투나 흐름까지 직접 확인하면서, 사용자 입장에서 만족스러운 결과를 내는지 계속 검토하는 게 중요하다고 생각합니다.

현정님: 모델 개발에는 주로 PyTorch와 Ray를 사용하고 있어요. 특히 Ray는 모델 크기가 커지는 상황에서 분산 처리를 구현할 때 유용하게 사용돼요. 실험 환경은 Docker, DVC, MLflow, Optuna 같은 도구들을 활용해 안정적으로 구성하고 있습니다.

재경님: 저는 대부분 Python 기반의 PyTorch 프레임워크를 사용하고 있어요. 실험 결과를 관리할 땐 W&B나 MLflow 같은 툴이 특히 유용한데요, 복잡한 실험 과정을 추적하고 재현하는 데 도움이 됩니다. 또 대규모 분산 학습에서는 Distributed PyTorch와 Slurm을 가장 중요하게 사용 중이에요. 모델이 커짐에 따라 GPU를 분할해 병렬로 처리하는 구조가 필수가 되었고, 이를 안정적으로 운영하는 것이 성능 향상에 큰 역할을 하고 있습니다.

현정님: 실무를 하면서 대학원 때처럼 트렌드를 따라가는 건 확실히 쉽지 않지만, 흐름을 놓치지 않기 위해 개인적인 방식으로 꾸준히 학습하고 있어요. 업무 중 궁금했던 내용이나 커뮤니티에서 본 이슈들은 바로바로 노션에 아이디어 노트로 남기고, 출퇴근길이나 쉬는 시간처럼 짧은 시간에 꺼내보며 정리해 두고 있어요. 내용이 복잡하다 싶으면 따로 시간을 내서 깊이 있게 공부하기도 하고요. 또, 같은 AI R&D 분야에 있는 동기들과 함께 스터디도 운영하고 있어요. 다양한 개발 분야에서 일하는 사람들이 함께 참여하고 있어서 내 업무 외의 영역도 자연스럽게 접할 수 있고, 자극이 되기도 하고 새로운 관점을 얻는 경우도 많아요.

재경님: 저는 Hugging Face 커뮤니티에서 운영하는 ‘Daily Paper’ 구독을 활용하고 있어요. 매일 주요 논문 10여 편이 올라오는데, 아침마다 관심 있는 논문들의 제목과 초록만이라도 훑어보려고 해요. 간단한 정리만으로도 흐름을 따라가기에 꽤 도움이 되더라고요. 또 슬랙에 좋은 논문을 공유하는 채널이 있어서, 그곳을 통해서도 자연스럽게 정보를 접하고 있습니다. 그리고 현정님과 함께 한 달에 한 번 머신러닝 스터디를 진행하고 있어요. 논문 세미나도 함께 하면서 서로 공부한 내용을 나누고, 새로운 기술이나 개념을 접할 수 있어 실무에 큰 도움이 되고 있습니다.

현정님: 저는 다양한 팀 프로젝트를 많이 경험해보셨으면 좋겠어요. 학교나 연구실은 목표가 명확하고 조건이 통제된 환경이라면, 회사는 훨씬 복잡하고 변화무쌍한 환경이에요. 같은 개발자끼리 협업하는 것뿐만 아니라, 기술을 잘 모르는 사람에게 설명해야 할 때도 있고, 이해관계가 다른 상황에서 내가 생각하는 방향을 관철시켜야 하는 일도 생기죠. 강화학습에 비유하자면, 학교는 단 하나의 조건에서 최적 행동을 반복 학습하는 구조라면, 회사는 수많은 조건이 상호작용하는 환경에서 최선의 선택을 찾아야 하는 공간이에요. 그래서 입사 전, 나를 다양한 조건에 노출시켜 pre-training 해보는 게 정말 도움이 될 거예요.

재경님: 많은 분들이 ‘논문이 없으면 R&D 취업이 어렵냐’고 묻는데, 저는 논문 자체보다 그 과정을 경험해보는 게 훨씬 중요하다고 생각해요. 결국 논문도 하나의 프로젝트거든요. AI 모델을 기획하고, 실험을 설계하고, 그 결과를 논리적으로 정리하는 일련의 과정을 해보는 것 자체가 훌륭한 훈련이 됩니다. 논문이 없어도 괜찮으니, 대신 다양한 프로젝트를 경험하고, 그 완성도를 높이는 데 집중하셨으면 좋겠어요. 그렇게 쌓은 경험들이 나중에 훨씬 더 설득력 있는 포트폴리오가 될 거라고 생각합니다.

현정님: 좋은 개발자가 되기 위해선 ‘내가 맡은 영역 외의 흐름도 이해해보려는 태도’가 중요하다고 생각해요. AI 코딩 툴이 워낙 발달하다 보니, 단순히 코드를 잘 짜는 능력만으로는 차별화되기 어려운 시대잖아요. 저연차 때는 주로 플레이어로서 직접 개발에 몰두하지만, 경력이 쌓이면 컨트롤러로서 전체를 조율하는 역할이 점점 더 많아지거든요. 그럴 땐 내가 잘 모르는 영역이라도 최소한 어떤 흐름인지 이해하고 있어야 좋은 아키텍처를 설계할 수 있어요. ‘난 모델만 하고 싶은데 왜 이걸 알아야 해?’라는 태도는 결국 성장에 한계를 만들 수 있다고 생각합니다.
 
재경님: 저는 ‘질문하는 자세’가 가장 중요한 태도라고 생각해요. 실제로는 많은 걸 다 알 필요도 없고, 정답이 명확하지 않은 경우가 대부분이기 때문에, 모르면 바로 물어보고 경험해보는 자세가 훨씬 더 중요하다고 느껴요. 예를 들어 저는 석사 시절 자율주행 로봇 분야에서 강화학습을 전공했는데, 그 기술이 LLM 고도화에 적용되는 걸 지금 직접 경험하고 있어요. 그만큼 기술이 언제 어디에 활용될지 알 수 없기 때문에, 다양한 분야를 넓게 경험하고, 열린 태도로 계속 질문하고 배우려는 자세가 정말 큰 힘이 됩니다.

현정님: AI R&D란 건물을 짓는 일입니다.

부친이 건설업에 종사하시는데, 제가 하는 일과 너무 닮아 있다는 생각을 자주 해요. 데이터를 하나하나 수집하는 단계부터 시작해, 모델을 개발하고, 서비스로 제공되는 순간까지 모든 과정에 참여하는 지금의 업무가 마치 땅을 고르고, 설계하고, 적절한 자재를 활용해 완공하고, 사람들에게 인도하는 일련의 건축과정과 정말 비슷하더라고요.

 
재경님: AI R&D란 점묘화입니다.

지금 내가 찍고 있는 점이 어떤 그림의 일부인지 지금은 잘 모르겠지만, 매일 치열하게 점을 찍고 나면 언젠가 그 그림이 완성돼 있을 거라 믿어요. 조급해하지 않고, 하나하나의 점에 최선을 다하는 게 지금의 저에게는 가장 중요한 마음가짐인 것 같습니다.


 

AI R&D 개발자의 여정은 언제나 ‘더 나은 기술을 위한 고민’의 연속이었습니다.
정해진 답이 없기에 더 치열하고, 매 순간이 선택의 연속이기에 더 의미 있는 일!


이번 인터뷰가 AI R&D 직무를 고민하는 분들께 조금 더 구체적인 상상과 든든한 동기 부여가 되었기를 바랍니다.

바쁜 일정 속에서도 인터뷰에 참여해 주신 강현정 매니저님, 조재경 매니저님께 감사드립니다. 지금까지 SK텔레콤 취재기자 김민서였습니다. 감사합니다!