Canonical
on 9 May 2023
ChatGPT가 출시된 후, AI/ML 시장은 갑자기 모든 사람에게 매력적으로 다가왔습니다. 하지만 프로젝트를 시작하기가 그렇게 쉬울까요? 더 중요한 것은, AI 이니셔티브를 확장하기 위해 무엇이 필요할까요? 머신러닝 워크플로우 자동화에 대한 해답은 MLOps 또는 머신러닝 운영입니다.
MLOps 도입은 DevOps를 도입하는 것과 비슷합니다, 다른 사고방식과 작업 방식을 수용해야 합니다. 하지만 이런 종류의 이니셔티브가 창출하는 투자 수익은 그만큼 노력할 가치가 있습니다. 큰 그림을 볼 때 고려해야 할 핵심 측면이 두 가지 있습니다. 한편으로 MLOps는 비교적 새로운 실무이고 따라서 그 과정에서 어려움을 겪는 것은 지극히 정상입니다. 반면에 MLOps는 매우 빠르게 진화하고 있기 때문에 매일 솔루션이 등장하고 있습니다. 기업들이 일반적으로 어떤 어려움을 겪고 있으며, 가장 일반적인 MLOps 문제를 어떻게 극복할 수 있을까요? 이 블로그에서 이 질문들에 대해 자세히 알아보겠습니다.
MLOps 과제 #1: 인재 부족
Glassdoor에 의하면, 데이터 과학과 관련된 직업은 3만 개 이상이며 다른 차원의 경력, 학습 및 기술이 요구되는 ML 엔지니어 관련 직업은 1만 5천 개 이상입니다. 데이터 과학 커리어는 매우 매력적이 되었으며 시장에는 많은 기회가 있습니다.
이 데이터를 다른 각도에서 분석해보면 기업들은 머신러닝 이니셔티브를 지원하기 위해 인력에 점점 더 많은 투자를 하고 있습니다. AI 프로젝트를 우선시하며 장비뿐만 아니라 인재에도 투자하고 있습니다. 그러나, 능력 있는 인재를 발견하고 ML 및 데이터 과학에 특화된 팀의 이탈을 감소하는데 어려움이 발생합니다. 기술 부족 및 직원 이탈은 ML 수명주기의 배포뿐만 아니라 모든 새로운 이니셔티브를 시작하는 데 필요한 일정에 영향을 미칩니다.
경쟁이 치열하기 때문에 이 어려움을 완화하기는 어렵습니다. 원격 고용은 능력이 더 뛰어난 인재를 확보할 기회를 늘리기 때문에 한 가지 옵션이긴 합니다. 또 다른 좋은 기회는 인턴십이나 대학원 프로그램을 통해 회사 내에서 기술을 개발할 수 있는 젊은 인재를 고려하는 것입니다. 이것은 장기적인 전략인 반면에, 단기적인 솔루션으로는 컨설팅 서비스를 제공하는 회사를 고용하면 기업이 AI 여정을 시작하는 데 도움이 될 수 있습니다. AI 준비 상태에 따라 기업은 사용 사례, MLOps 아키텍처 또는 개념 증명에 대한 가이드를 구할 수 있습니다.
여러분의 팀이 AI 모델을 배포하고 가치를 제공하는 데 도움이 되는 자문 서비스 및 제품: 더 읽어보기
MLOps 과제 #2: 시작하기
AI 프로젝트를 시작하는 것은 대부분의 기업들에게 어려운 일입니다.
AI를 시작하는 것은 비즈니스 케이스를 보유하는 것만큼 간단합니다. 다음 세 가지 주요 질문에 답을 해보면 여러분이 실제로 무엇을 달성해야 하는지 더 잘 파악하는 데 도움이 될 것입니다:
- 어떤 문제를 해결하려고 하는가?
- 기대치가 현실적인가?
- 올바른 데이터를 보유하고 있는가?
요컨대, AI 이니셔티브를 시작하려면 목적을 염두에 두고 시작하고 그 목적을 향해 구현해 나가야 합니다. 그런 다음 회사의 AI 준비 상태를 평가하고 자체 프로그램을 제작할 수 있습니다. 격차, 핵심 요소, 피해야 할 일반적인 실수 또는 함정, 인프라 문제를 고려한 질문을 통해 기업이 AI를 시작할 준비가 얼마나 되어 있는지 보다 심층적으로 살펴볼 수 있습니다. 이러한 질문에 답을 내리면 전체 AI 이니셔티브에 대한 설계로 이어집니다. 궁극적으로 이 같은 설계는 팀이 우선순위를 정하고, 예산을 결정하고, 적절한 일정을 설정하는 데 도움이 됩니다.
MLOps 과제 #3: 데이터
모든 AI 프로젝트의 중심에는 데이터가 있습니다. 모든 이니셔티브의 성공과 실패를 결정하는 핵심적인 부분입니다.
데이터 품질과 데이터 액세스 포인트 모두 평가하기 위해서는 유효성 검사가 필수입니다. 지금은 어디에나 널리 퍼져 있는 것처럼 보이지만, 데이터가 언제나 대부분의 기업에 우선순위였던 것은 아닙니다. 이것이 데이터 수집 프로세스가 제대로 정의되지 않은 경우가 많은 이유이며, 그 결과 부정확하고 일관성 없는 데이터가 생성됩니다.
데이터 준비는 전반적으로 쉽지 않습니다. 조직은 데이터 거버넌스, 수집 및 저장 측면에서 큰 어려움에 직면할 수 있습니다. 데이터는 여러 소스에서 획득되는 경우가 많기 때문에 값과 형식이 일치하지 않는 경우가 발생합니다. 또 다른 관점에서는, 머신러닝 모델은 대량의 데이터에 의존하는데, 많은 분량의 데이터는 다루기 어려운 경우가 많습니다.
이 문제는 여러 차원에서 영향을 미치기 때문에 이를 해결하는 데는 여러 가지 뉘앙스가 포함되어 있습니다. 데이터를 부지런히 취급하는 것이 아마도 성공의 비결일 것입니다. 데이터 불일치를 제한하고 중앙 집중식 데이터 저장소를 사용하면 데이터 준비 단계가 쉬워집니다. 데이터 버전 관리는 데이터에 나타나는 변경 사항으로 인해 발생하는 문제를 해결합니다.
MLOps 과제 #4: 보안
머신러닝은 종종 매우 민감한 프로젝트에서 운영되고 민감한 데이터를 다룹니다. 따라서, 프로젝트의 장기적인 성공에는 안전한 환경을 보장하는 것이 필수입니다. IBM이 최근 발행한 AI 도입 보고서에 따르면 5곳의 기업 중 1곳은 데이터 보안 확보에 어려움을 겪고 있습니다. 그 결과 이 문제를 해결하는 사람의 수가 증가하고 있으며, 이것은 응답자의 25%가 보안 전문가인 이유를 설명합니다.
보안과 관련된 문제 중 가장 일반적인 문제는 낙후된 라이브러리를 실행하는 것입니다. 사용자들은 자신들에게 여러 취약점이 있으며, 이는 악의적인 공격의 기회가 될 수 있다는 사실을 인지하지 못하는 경우가 많습니다.
또 다른 보안 함정은 제대로 보호되지 않는 모델 엔드포인트 및 데이터 파이프라인과 관련이 있습니다. 모델 엔드포인트 및 데이터 파이프라인은 때때로 공개적으로 접근할 수 있어 민감한 메타데이터가 제3자에게 노출될 가능성이 있습니다. 엔드포인트는 개발 환경이며, 그에 걸맞게 취급하는 것은 프로젝트의 보안뿐만 아니라 데이터 보안을 보장하는 명확한 보안 표준을 갖추는 것을 의미합니다.
보안은 어느 MLOps 환경에서든 문제가 될 수 있으므로 보안 패치 및 지원을 제공하는 소프트웨어를 실행하는 것은 프로젝트의 존재와 프로덕션 배포를 위해 필수입니다. 멀티테넌시 옵션이 있는 툴을 사용하면 내부 환경, 데이터 프라이버시 및 대중에게 민감할 수 있는 다양한 이니셔티브의 안전을 확보할 수 있습니다.
가이드에서 MLOps에 대해 자세히 알아보고 기업에서 MLOps를 활성화하는 방법을 알아보세요.
MLOps 과제 #5: 확장
McKinsey가 2022년 AI 현황 보고서에서 언급했듯이 다수의 조직이 AI를 실험하는 수준에서 기업 애플리케이션에 적극적으로 포함하는 단계로 크게 전환했습니다. 이 같은 현상은 한편으로는 AI에 대한 기업들의 의지를 확인시켜주지만, 다른 한편으로는 확장에 대한 지식과 능력에 대해 많은 의문을 제기합니다. 프로덕션으로 모델을 배포하고 모니터링하는 데 적합한 워크플로우와 도구를 갖추는 것부터 이 같은 이니셔티브를 지원하는 데 필요한 인프라를 보유하는 것까지, 기업들은 빠르게 새로운 업무를 배우고 적응해야 할 것입니다.
많은 사람이 머신러닝에 오픈 소스를 선호합니다. Charmed Kubeflow 같은 엔드투엔드 MLOps 플랫폼은 시중에 나와 있는 오픈 소스 옵션 중 하나입니다. 데이터 과학자들이 이미 익숙한 툴 세트를 활용하여 자동화, 모니터링, 경고, 통합 및 배포 등의 확장과 관련된 여러 요구 사항을 해결합니다. 가장 일반적인 MLOPs 문제를 해결하는 데 이상적입니다.
MLOps에 대해 자세히 알아보기
- [웨비나] MLOps 소개
- [웨비나] MLOps 플랫폼을 활용한 하이퍼파라미터
- [화이트 페이퍼] MLOps 가이드