- Align Evals๋ LLM ์ ํ๋ฆฌ์ผ์ด์ ํ๊ฐ๋ฅผ ๊ฐ์ํํ์ฌ, LLM์ ์ฌํ์ผ๋ก ์ฌ์ฉํ๋ ํ๊ฐ์ ์์ฑ ๊ณผ์ ์ ๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋ฐฉ์์ผ๋ก ๊ฐ์ ํฉ๋๋ค. ๐
- Langsmith๋ LLM ์ ํ๋ฆฌ์ผ์ด์ ๊ด์ฐฐ ๋ฐ ํ๊ฐ ํ๋ซํผ์ผ๋ก, Langchain๊ณผ ํจ๊ป ๋๋ ๋ ๋ฆฝ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ์์ด์ ํธ ํ๊ฐ๋ฅผ ์ํ ํจ์จ์ ์ธ ํ๋ฆ์ ์ ๊ณตํฉ๋๋ค. ๐ฌ
- Align Evals์ ํต์ฌ์ ๋ํ์ ์ธ ์ํ ์คํ์ ์์งํ๊ณ , ์ ๋ฌธ๊ฐ๊ฐ ๋ผ๋ฒจ๋งํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก LLM ์ฌํ ํ๋กฌํํธ๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํ์ฌ ์ฌ๋์ ํ๋จ๊ณผ ์ผ์น๋๋ฅผ ๋์ด๋ ๊ฒ์ ๋๋ค. ๐งโ๐ซ
- ๋ ์ํผ ์์ฑ ์์์์ ๋ถํ์ํ ํ์ฉ์ฌ ์ ๊ฑฐ ๊ธฐ์ค์ ํ๊ฐํ๊ธฐ ์ํด, ๋ฐ์ดํฐ์ ์ ํ๊ฐ์๋ฅผ ์ถ๊ฐํ๊ณ ์คํ์ ๋ผ๋ฒจ๋งํ์ฌ LLM ์ฌํ ํ๋กฌํํธ๋ฅผ ์์ฑํ๊ณ ์กฐ์ ํฉ๋๋ค. ๐ณ
- ํ๊ฐ์ ํ๋ ์ด๊ทธ๋ผ์ด๋์์ ํ๋กฌํํธ๋ฅผ ์์ฑํ๊ณ ์คํ ๊ฒฐ๊ณผ์ ์ฌ๋์ ๋ผ๋ฒจ๋ง์ ๋น๊ตํ์ฌ ์ ๋ ฌ๋๋ฅผ ์ธก์ ํ๋ฉฐ, ํ์์ ๋ฐ๋ผ ํ๋กฌํํธ๋ฅผ ์์ ํ์ฌ ์ ๋ ฌ๋๋ฅผ ๊ฐ์ ํฉ๋๋ค. โ๏ธ
- ๋ชจ๋ธ ๋ณ๊ฒฝ, ์ถ๋ก ํฌํจ ๋ฑ์ ์กฐ์ ์ ํตํด ํ๊ฐ์์ ์ ํ๋๋ฅผ ๋์ด๊ณ , ์๋ก์ด ์คํ์ ์คํํ์ฌ ๊ฐ์ ๋ ํ๊ฐ์๋ฅผ ํตํด ํ๋กฌํํธ์ ์ฑ๋ฅ์ ํ๊ฐํฉ๋๋ค. ๐ฏ
- Langsmith๋ฅผ ํตํด ํ๋กฌํํธ์ ํ๊ฐ์๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํ๊ณ , Align Evals์ ํธ๋ฆฌํ UX๋ฅผ ํตํด ๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋ฐ ํ๊ฐ์ ์ ๋ ฌ์ ํจ์จ์ ์ผ๋ก ์ํํ ์ ์์ต๋๋ค. โจ
- Eugene Yan์ Align Eval์์ ์๊ฐ์ ๋ฐ์ ๊ฐ๋ฐ๋์์ผ๋ฉฐ, ํ์ฌ ์ผ๋ฐ ์ฌ์ฉ์ด ๊ฐ๋ฅํฉ๋๋ค. ๐



![[์ฝํฉ x ๊ต๋ณด๋ฌธ๊ณ ] AI ๋์ ๋์ง ์๋ ๋์์ธ ํ๋๋ฒ](https://i1.ytimg.com/vi/dVzhPfg6qCQ/hqdefault.jpg)

