Learn Pandas in 30 Minutes - Python Pandas Tutorial
- 판다스는 데이터 과학, AI, 머신러닝, 데이터 시각화에 필수적인 라이브러리입니다. 🐼
- 판다스를 사용하려면 먼저
pip install pandas
또는 pip3 install pandas
명령어로 설치해야 합니다. 💻
- 가상 환경을 사용하여 판다스를 설치할 수도 있습니다 (
uvit .
후 uv add pandas
). 📦
- 판다스는 주로
DataFrame
과 Series
라는 두 가지 주요 데이터 타입을 다룹니다. 📊
DataFrame
은 2차원 테이블 형태의 데이터 구조이며, Series
는 1차원 배열 (열 또는 행)입니다. 🔢
- 판다스를 사용하여 CSV 파일이나 엑셀 스프레드시트와 같은 다양한 형식의 데이터를 로드할 수 있습니다. 💾
df = pd.read_csv('orders.csv')
를 사용하여 CSV 파일을 DataFrame으로 읽어올 수 있습니다. 📚
- Jupyter Notebook을 사용하면 코드 셀 단위로 실행하며 데이터 분석 및 실험을 더 쉽게 할 수 있습니다. 🚀
df.head()
는 DataFrame의 처음 5개 행을 보여주고, df.tail()
은 마지막 5개 행을 보여줍니다. 👀
df.info()
는 DataFrame의 열 이름, 데이터 타입, 메모리 사용량 등의 기본 정보를 제공합니다. ℹ️
df.describe()
는 수치형 데이터에 대한 통계 정보 (평균, 표준편차, 최소값, 최대값 등)를 요약하여 보여줍니다. 📈
df.columns
는 DataFrame의 모든 열 이름을 리스트 형태로 반환합니다. 📝
df.index
는 DataFrame의 인덱스 범위를 나타냅니다. 🧮