- ์ค๊ตญ์ Muan์ด๋ผ๋ ํ์ฌ์์ Long Cat Flash Chat 560B๋ผ๋ ์๋ก์ด AI ๋ชจ๋ธ์ ์ถ์ ๐
- ์ด ๋ชจ๋ธ์ Mixture of Experts (MOE) ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํ์ฌ ํจ์จ์ ์ธ ์ฐ์ฐ ํ์ฉ ์ ๋ต์ ์ฑํ, ํ ํฐ ์ค์๋์ ๋ฐ๋ผ ๋์ ์ผ๋ก ์ฐ์ฐ ์์์ ํ ๋น ๐ง
- ์ ์ฒด 5600์ต ๊ฐ ํ๋ผ๋ฏธํฐ ์ค ์ค์ ํ ํฐ์ ๋ํด 186์ต~313์ต ๊ฐ ํ๋ผ๋ฏธํฐ๋ง ํ์ฑํํ์ฌ ์ฐ์ฐ ํจ์จ์ฑ์ ๋์ ๐ก
- 20์กฐ ๊ฐ์ ํ ํฐ์ผ๋ก 5600์ต ๊ฐ ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ์ ๋จ 30์ผ ๋ง์ ์ฌ์ ํ๋ จ ์๋ฃ, ๋น ๋ฅธ ๋ชจ๋ธ ๋ฐ๋ณต ๊ฐ๋ฅ์ฑ์ ์์ฌ ๐
- ์ด ๋ชจ๋ธ์ ์์ด์ ํธ ๋ฐ ์ฝ๋ฉ ๊ด๋ จ ์์ ์ ํนํ๋์ด ์์ผ๋ฉฐ, ํนํ ํฐ๋ฏธ๋ ๋ฒค์น๋งํฌ์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ ๐ป
- Mid-training ๊ณผ์ ์์ ์ถ๋ก ๋ฐ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ๊ฐํํ๊ณ ์ปจํ ์คํธ ๊ธธ์ด๋ฅผ 128k๊น์ง ํ์ฅ ๐
- ์์ด์ ํธ post-training ์๊ตฌ ์ฌํญ์ ์ถฉ์กฑํ๊ธฐ ์ํด multi-agent ํฉ์ฑ ํ๋ ์์ํฌ๋ฅผ ์ค๊ณํ์ฌ ๋ณต์กํ ์์ ์ ์์ฑํ๊ณ ๋ฐ๋ณต์ ์ธ ์ถ๋ก ๋ฐ ํ๊ฒฝ ์ํธ ์์ฉ์ ์ ๋ ๐ค
- ํฐ๋ฏธ๋ ๋ฒค์น์์ Deepseek v3.1๋ณด๋ค ๋์ ์ ์๋ฅผ ๋ฐ์์ผ๋ฉฐ, Claude 4 Sonnet์ ๊ทผ์ ํ ์ฑ๋ฅ์ ๋ณด์ ๐
- Agentic ๋ฒค์น๋งํฌ(PI2 bench, VA bench)์์ Gemini 2.5 Flash, Claude 4 Sonnet, GPT-4.1 ๋ฑ์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ ๐ช
- MIT ๋ผ์ด์ ์ค๋ก ์ ๊ณต๋์ด ํ์ต ๋ฐ ํ์ฉ ๊ฐ๋ฅ์ฑ์ด ๋์ผ๋ฉฐ, longcat.hat ์น์ฌ์ดํธ์์ ๋ชจ๋ธ์ ์ง์ ์ฌ์ฉํด ๋ณผ ์ ์์ ๐
- Muan์ ๋ฐฐ๋ฌ ์๋น์ค ๋ฐ ์๋ฃํ ๊ธฐ์ ์ ์ ๊ณตํ๋ ํ์ฌ๋ก, ์ด ๋ถ์ผ์์ ๊ธฐ์ด ๋ชจ๋ธ์ ์ถ์ํ ๊ฒ์ ์ด๋ก์ ์ ๐ข