현
현대자동차
September 3, 20241회
[딥러닝 경량화] 딥러닝 네트워크 양자화(quantization)는 왜 필요할까?
간단 소개
딥러닝 모델 경량화를 위한 양자화 기법의 필요성, 방법, 과정, 결과 분석 및 고려 사항을 제시합니다.
AI Summary
- 딥러닝 양자화 필요성
- 에지 디바이스의 제한된 자원(메모리, 컴퓨팅, 전력)으로 인해 딥러닝 모델 경량화가 필수적이며, 양자화는 이를 위한 핵심 기술임
- 양자화는 모델 weight 값을 저장하는 데 필요한 비트 수를 줄여 모델 크기를 감소시키고, 추론 속도를 향상시킴
- 양자화 방법 및 과정
- **PTQ(Post Training Quantization)**와 QAT(Quantization Aware Training) 두 단계로 수행 가능
- FP32 모델 프로파일링을 통해 하드웨어 지원 여부, 이슈 확인, layer 별 latency 분석 후 대체 layer 선정
- PTQ는 기존 모델과 데이터를 활용한 calibration을 통해 int8 모델에 데이터 범위 반영
- QAT는 PTQ 값을 기반으로 qdq layer를 포함한 모델을 학습하여 최적화
- 양자화 결과 및 고려 사항
- ONNX graph 비교를 통해 qdq layer 삽입 확인 및 latency 감소 효과 검증 (약 67% latency 감소)
- Data calibration, batch-norm folding, 하드웨어 제조사별 PTQ 방식 등 다양한 요소 고려 필요
Next Feeds

무진장 블랙 프라이데이 가격 할인은 어떻게 할까?
무신사 블프 세일 시스템 개선 과정을 통해 운영 효율을 극대화하고 파트너 참여를 준비하는 과정을 설명합니다.
무신사블랙프라이데이세일 시스템가격 API운영 효율
2024. 9. 2.
무신사
Resilience4j Circuit Breaker를 이용한 장애 대비하기
Resilience4j Circuit Breaker를 이용한 장애 대비 전략, 동작 원리, 설정 옵션 및 예제를 통해 시스템 안정성 확보 방안을 제시합니다.
Resilience4jCircuitBreaker장애대비내결함성시스템 안정성
2024. 9. 1.
NHN

기기와 앱의 무결성 보장부터 서비스 요청 보호까지: LINE의 기기 증명 서비스 - 2편
LINE은 기기 증명 서비스를 도입하여 Android와 iOS 앱에 적용, 서비스 남용 방지 및 보안 강화. 향후 Risk Metric 활용 및 고보안 서비스 확장을 계획.
기기 증명LINEAndroidiOSRisk Metric
2024. 8. 30.
LY Corp

SK플래닛 개발자들의 GitHub Copilot 활용기(AI-assisted Coding과 개발 생산성 향상 #2)
SK플래닛의 GitHub Copilot 활용 사례 및 생산성 향상 실험 결과, 개발자 경험에 미치는 영향 분석.
GitHub CopilotAI-assisted Coding개발 생산성코드 자동완성DevX
2024. 8. 30.
skplanet

쏘카 프론트엔드 모노레포 - Part1. Code Generator로 프로젝트 세팅 자동화하기
쏘카는 프론트엔드 모노레포 도입과 Code Generator를 통해 개발 효율성을 높이고 코드 품질을 개선했습니다.
모노레포Code GeneratorTurborepoPlop프론트엔드
2024. 8. 29.
쏘카
양자컴퓨팅 알고리즘 개발 - 중첩상태의 이해
양자컴퓨터의 핵심 개념인 중첩 상태를 디지털 컴퓨터의 비트와 비교하여 설명하고, 슈뢰딩거의 고양이 사고실험과 Hadamard gate를 통해 이해를 돕는다.
양자컴퓨터중첩상태큐빗비트Hadamard gate
2024. 8. 29.
현대자동차