빅
빅웨이브에이아이
February 21, 20241회
Mergekit, LLM을 한번 합쳐보자!
간단 소개
Mergekit은 LLM 병합 툴킷으로, 다양한 모델과 병합 방식을 지원하며, 허깅페이스 연동이 용이하다.
AI Summary
- Mergekit 소개 및 특징
- Mergekit은 LLM을 병합하는 툴킷으로, LLAMA, MISTRAL, GPT-NeoX 등 다양한 모델을 지원한다.
- Linear, SLERP, Task Arithmetic 등 여러 병합 방법을 제공하며, GPU 가속화 및 텐서 지연 로딩을 통해 메모리 효율성을 높인다.
- Mergekit 사용법 및 YAML 파일 구성
- argument 또는 jupyter notebook을 통해 사용 가능하며, YAML 파일을 통해 병합 방법, 레이어 슬라이스, 모델 정의, 파라미터 등을 설정한다.
- 주요 병합 방법론으로는 가중치 평균(Linear), 구면 보간(slerp), 작업 벡터 활용(task_arithmetic) 등이 있다.
- 실제 활용 예시 및 결론
- SOLAR와 DataVortexS 모델을 Mergekit으로 병합하여 Open-Ko-LLM 리더보드에서 좋은 결과를 얻었다.
- 허깅페이스에 병합 모델을 업로드하여 Langchain과 쉽게 연동할 수 있다. 로컬 환경에서의 GGUF 변환은 아직 지원되지 않는다.
Next Feeds

실행 시간 효율을 위한 클래스 데이터 공유(CDS)와 Layered Jar
자바 애플리케이션의 초기 구동 시간 단축을 위해 CDS와 Layered Jar를 활용하여 성능을 개선하는 방법을 제시합니다.
CDSLayered JarGraalVMJVMProject Leyden
2024. 2. 20.
넷마블

MongoDB Timeseries를 활용기
MongoDB Timeseries DB를 도입한 비브로스의 경험 공유: 배경, 특징, 활용 및 고민을 담았습니다.
MongoDBTimeseries DBBucket Pattern로그 분석데이터 플랫폼
2024. 2. 20.
비브로스

ARHIS: 음향 기반 도로 노면 검지 솔루션
SK플래닛의 ARHIS는 음향 기반 AI 기술로 도로 노면 상태를 실시간 검지하여 안전을 강화하는 혁신적인 솔루션입니다.
ARHIS음향 기반도로 노면 검지AI블랙 아이스
2024. 2. 18.
skplanet

금융 데이터의 이해와 분석의 가치
금융 데이터의 특징과 분석의 가치를 설명하고, 카카오뱅크의 데이터 분석 사례를 통해 전사적 데이터 역량 강화 방안을 제시합니다.
금융 데이터데이터 분석핵심 지표데이터 민주화카카오뱅크
2024. 2. 15.
카카오뱅크
![[엔클 날개] EP.8 : Gaza’s Child Read HOPE — 가자 지구 아이들을 위한 희망 메시지 책자 전달 프로젝트 개발기](https://miro.medium.com/v2/resize:fit:1200/1*jOpZl2hPkN37vFA13DO_LQ.jpeg)
[엔클 날개] EP.8 : Gaza’s Child Read HOPE — 가자 지구 아이들을 위한 희망 메시지 책자 전달 프로젝트 개발기
가자 지구 아이들을 위한 희망 메시지 책자 전달 프로젝트 개발기를 소개하고, Ncloud 활용 경험 및 Green Developers 프로그램 참여 소감을 공유합니다.
Ncloud가자지구희망메시지Green Developers언더독레볼루션
2024. 2. 13.
네이버클라우드플랫폼

다나와 Kotlin을 만나다!
다나와는 Kotlin을 도입하여 검색, 오피스, 빅데이터 파트에서 활용 중이며, 가독성 및 생산성 향상을 위해 지속적으로 연구하고 있습니다.
KotlinJavaElasticsearchnull-safetyscope 함수
2024. 2. 13.
다나와