GEMINI CLI로 VSCode에서 에이전트 모드로 데이터 분석하기
- Gemini CLI와 Gemini Code Assist를 활용하여 VSCode에서 데이터 분석을 수행하는 방법을 설명 👩💻
- 국가 중점 데이터셋 중 의약품 처방 정보 데이터를 활용하여 약 30만 건의 데이터를 분석 대상으로 함 📊
- Gemini CLI를 통해 PDF 문서에서 처방 정보를 분석하고 마크다운 파일로 생성하는 과정을 시연 📄
- PDF 문서에서 시도 코드와 연령대 코드를 추출하여 마크다운 파일에 추가하는 방법을 설명 🧑🏫
- CSV 파일을 참조하여 데이터 분석 방안을 마크다운 파일에 정리하고, 주피터 노트북 생성을 위한 프롬프트를 작성 ✍️
- 실제 CSV 파일의 컬럼 정보를 활용하여 분석 방안을 구체화하고, 시도 코드, 연령대 코드 등을 활용한 파생 변수 생성을 지시 🧬
- Gemini CLI를 통해 주피터 노트북 파일을 생성하고 실행하는 과정을 시연하며, UV 가상 환경 설정 및 활성화 방법을 안내 ⚙️
- 생성된 주피터 노트북 파일에서 데이터 로드, 전처리, 탐색적 데이터 분석(EDA) 과정을 거치며, 성별, 시도명, 연령대 등 파생 변수를 생성 💡
- 지역별, 연령대별, 성별, 월별 처방 건수 분석 및 처방 금액 분포 확인 등 다양한 EDA 기법을 활용 📈
- 깃허브 코파일럿을 활용하여 코드 수정 및 개선, 수치형/범주형 변수 기술 통계 작성 등 추가 분석 수행 🤖
- Gemini CLI 또는 코파일럿을 활용하여 기술 통계 보고서를 마크다운 셀로 작성하는 방법을 설명 📝
- Gemini Code Assist의 기능과 한계를 언급하며, 코드 어시스트보다는 코파일럿의 채 기능이 더 잘 동작하는 경향이 있음을 지적 🤔
- Gemini CLI, 코파일럿, Gemini Code Assist 등 다양한 도구를 함께 활용하여 데이터 분석 효율성을 높이는 방안을 제시 🚀
- Gemini CLI는 전체 파일 수정에 적합하고, 코파일럿/Gemini Code Assist는 세부 내용 수정에 적합함을 강조 🎯
- 클로드 코드 유료 사용이 부담스러울 경우 Gemini CLI와 보조 도구를 함께 활용하는 것을 추천 👍