- 파이썬과 AI를 활용하여 텍스트 데이터에서 지식 그래프를 생성하는 방법 소개 💡
- 지식 그래프는 노드(개체)와 릴레이션십(관계)으로 데이터를 표현하는 방식이며, 인물 관계도가 대표적인 예시 🧑🤝🧑
- 위키피디아의 '귀멸의 칼날' 애니메이션 줄거리를 활용하여 누가, 누구와, 어떤 관계인지 지식 그래프 형태로 변환 ⚔️
- 데이터 변환 과정은 위키피디아 데이터 수집, JSON 형태 데이터 추출, 시각화, 데이터 표준화 및 전처리 순으로 진행 ⚙️
- 챗GPT API를 이용하여 그래프 데이터 형태로 가공하며, 오픈AI API 키 발급 필요 🔑
- 네오4J 프롬프트 템플릿을 참고하여 텍스트를 지식 그래프 형태로 변환하는 예시 제시 📝
- 챗GPT를 이용하여 텍스트에서 노드와 관계를 추출하고, JSON 형태로 체계적으로 유형화 🤖
- 추출된 JSON 데이터를 지식 그래프 시각화 사이트를 통해 시각적으로 표현 📊
- LLM을 이용하여 텍스트 데이터에서 관계 및 노드 정보를 효율적으로 추출 가능 ⚡
- 기터브 코드를 복사하여 위키피디아 데이터 수집 및 JSON 형태 데이터 생성 💾
- UV 파이썬 패키지 매니저를 활용하여 데이터 수집 및 관리를 용이하게 수행 📦
- 파이덴틱 스키마 및 오픈AI 텍스트 포맷을 이용하여 정형화된 데이터 추출 및 활용 💎
- 그래프 데이터 결합 함수를 통해 여러 에피소드 데이터를 하나의 JSON 형태로 통합 🔗
- 시각화 도구를 활용하여 JSON 데이터를 시각적으로 표현하고, 데이터 패턴 파악 👁️
- 파이스 패키지를 이용하여 네트워크 데이터 그래프를 효과적으로 시각화 🕸️
- 데이터 전처리 및 표준화 과정을 통해 중복 및 불필요한 데이터 제거, 데이터 품질 향상 🧹
- 업데이트된 프롬프트를 이용하여 노드 및 관계 유형을 정의하고, 데이터 추출 정확도 향상 ✅
- 에피소드 정보를 릴레이션십 속성에 추가하여 데이터 활용도 증대 🎬
- 한글 이름으로 변환하는 로직을 추가하여 사용자 편의성 향상 🈯
- 최종 지식 그래프를 시각화하여 주요 인물 간 관계 및 에피소드별 특징 파악 🗺️