12 Minutes to Learn NumPy (Python): Arrays, Reshape, Arange & Linspace
- NumPy는 Numerical Python의 약자로, Python에서 수치 연산을 효율적으로 수행하기 위한 라이브러리다. 🐍
- NumPy 배열은 zeros, ones, arange, linspace 함수를 통해 쉽게 생성할 수 있으며, 배열 내 모든 요소는 자동으로 float 형태로 변환된다. 🔢
- reshape 함수를 사용하면 데이터 변경 없이 배열의 차원을 자유롭게 변경할 수 있어, 머신러닝 및 딥러닝 모델에 적합한 형태의 데이터로 변환할 수 있다. 🧊
- NumPy의 인덱싱 및 슬라이싱은 Python의 리스트와 유사하게 동작하지만, 다차원 배열에서는 쉼표(,)를 사용하여 행과 열을 구분하는 콤마 표기법을 사용한다. 🔪
- NumPy는 제곱근(sqrt), 지수(exp)와 같은 수학 연산 함수를 내장하고 있어, Python 기본 연산보다 훨씬 빠른 속도로 수치 계산을 수행할 수 있다. ➗
- NumPy는 평균(mean), 표준 편차(std), 최소값(min), 최대값(max), 중앙값(median)과 같은 통계 함수를 제공하여, 데이터 분석에 유용하게 활용할 수 있다. 📊
- Boolean indexing을 사용하면 특정 조건에 맞는 데이터만 추출하여 새로운 배열을 생성할 수 있어, 데이터 필터링 작업을 효율적으로 수행할 수 있다. 🪢
- Broadcasting은 NumPy 배열의 크기가 서로 다를 때 자동으로 크기를 맞춰 연산을 수행하는 기능으로, 벡터와 행렬 간의 연산을 간편하게 처리할 수 있다. 📻
- NumPy는 다양한 난수 생성 함수를 제공하며, seed 값을 설정하여 재현 가능한 결과를 얻을 수 있다. 🎲
- concatenate, vstack, hstack 함수를 사용하여 여러 NumPy 배열을 결합할 수 있으며, 데이터 구조에 따라 수직 또는 수평으로 배열을 쌓을 수 있다. 🧱