- 파이썬 문자열 인덱싱은 생각보다 복잡하며, 문자(character)는 다양한 의미를 가질 수 있음 🤯.
- CPython에서 문자열은 유니코드 코드 포인트로 저장되며, 이는 각 문자에 할당된 숫자임 🔢.
- 그래프임(grapheme)은 우리가 일반적으로 인식하는 하나의 문자이고, 그래프임 클러스터는 여러 코드 포인트로 구성될 수 있음 👨👩👧👦.
- 특정 문자들은 다이어크리틱(diacritic, 발음 구별 기호)을 포함하여 여러 코드 포인트로 표현될 수 있으며, 이로 인해 문자열의 길이가 예상과 다를 수 있음 📏.
- 터미널 환경에 따라 특정 문자(특히 다이어크리틱 포함)가 제대로 렌더링되지 않을 수 있음 🖥️.
- 그래프임 클러스터를 제대로 가져오려면 슬라이스 표기법을 사용해야 함 🔪.