김대리, SQL 팡션? 사용하지 마세요. MCP 쓰세요: AI 기술을 이용한 데이터 민주화
- 카카오 게임즈는 게임별 데이터 사일로, 유저 중심 데이터 부족, 노하우 공유 한계 등 기존 데이터 활용에 어려움을 겪었습니다. 🚧
- 이러한 문제를 해결하고 데이터 접근성을 높이기 위해 'KP' 프로젝트를 통해 데이터 민주화를 목표로 삼았습니다. 🗳️
- 현업에서는 데이터 활용의 기술적 장벽과 분석가 의존성으로 인해 비효율적인 업무가 발생했습니다. 📉
- 스노우플레이크 도입으로 세밀한 권한 제어가 가능해졌고, LLM 및 MCP 기술 발전으로 AI를 통한 데이터 조회의 가능성이 열렸습니다. ❄️
- 초기 MCP 단독 연결 실험은 부정확하고 느린 SQL 생성, 높은 비용 소모로 실패했습니다. ❌
- 이를 보완하기 위해 MCP 데이터랩(데이터 자산 래핑)과 쿼리 원원(중앙 집중식 SQL 저장소)을 개발했습니다. 🛠️
- MCP는 외부 시스템과 AI 모델을 연결하는 표준화되고 확장성 높은 프로토콜로, 낮은 개발 비용으로 데이터 자산과 AI를 연결하는 게이트웨이 역할을 합니다. 🔌
- 쿼리 원원은 고품질 SQL을 관리하고 벡터 기반 자연어 검색을 지원하며, 카스(KASS) 시스템의 SQL을 초기 자산으로 활용하여 높은 정확도를 확보했습니다. 📚
- MCP 데이터랩과 쿼리 원원 도입 후, SQL 쿼리 비용 93% 절감 및 데이터 획득 시간 91% 단축이라는 큰 성과를 달성했습니다. 💰
- 쿼리 원원에 없는 완전히 새로운 SQL 요청에 대응하기 위해 업무 맥락을 활용하는 MCP 도구인 'CAT(Contextual Thinking)'을 고안했습니다. 🧠
- CAT은 구조화된 입력과 단계별 사고 기록을 통해 도메인 지식 기반의 SQL 생성을 지원하여 새로운 요청에 대한 대응력을 높입니다. ✨
- 최종적으로는 유사 SQL은 쿼리 원원이, 새로운 SQL은 CAT이 생성하고, 사용자 평가 및 공유를 통해 SQL 품질을 지속적으로 개선하는 선순환 구조를 목표로 합니다. 🔄
- 이러한 AI 기반 데이터 민주화 시도를 통해 개인화 서비스, 게임 운영 최적화 등 다양한 새로운 서비스 창출을 기대하고 있습니다. 🚀