ํ™ˆ์œ ํŠœ๋ธŒ๋ธ”๋กœ๊ทธTop 10
๋‚ด ํ”„๋กœํ•„

๋ฐ๋ธŒํ—ˆ๋ธŒ ์•ˆ๋‚ด
์†Œ๊ฐœ์—…๋ฐ์ดํŠธ ์†Œ์‹

๋ฐ๋ธŒํ—ˆ๋ธŒ ์ปค๋ฎค๋‹ˆํ‹ฐ

Groq's new Magic for 1600+ Tokens/Second ๐Ÿช„

1littlecoder

2024. 11. 18.

0ํšŒ

#ai
  • Gro๊ฐ€ Speculative Decoding ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜์—ฌ Llama 3.1 70 billion parameter ๋ชจ๋ธ์˜ inference ์†๋„๋ฅผ 250 tokens/second์—์„œ 1,665 tokens/second๋กœ 6.6๋ฐฐ ํ–ฅ์ƒ ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. โšก
  • ์ด ์†๋„ ํ–ฅ์ƒ์€ ํ•˜๋“œ์›จ์–ด๋ฅผ ๋ณ€๊ฒฝํ•˜์ง€ ์•Š๊ณ  ๋‹จ์ˆœํžˆ ์†Œํ”„ํŠธ์›จ์–ด ํŠœ๋‹์„ ํ†ตํ•ด ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ๐Ÿ’ป
  • Speculative Decoding์€ ์ž‘์€ ๋ชจ๋ธ๋กœ ๋จผ์ € ๋ช‡ ๊ฐœ์˜ ํ† ํฐ์„ ์˜ˆ์ธกํ•œ ํ›„, ํฐ ๋ชจ๋ธ๋กœ ๊ฒ€์ฆํ•˜์—ฌ ์†๋„๋ฅผ ๋†’์ด๋ฉด์„œ๋„ ํ’ˆ์งˆ ์ €ํ•˜๋ฅผ ์ตœ์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค. ๐Ÿ”
  • ์ด๋กœ ์ธํ•ด ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์˜ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ (์˜ˆ: ์ฑ—๋ด‡, ๋ฒˆ์—ญ)์—์„œ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋น ๋ฅด๊ณ  ์ •ํ™•ํ•œ ๋ฐ˜์‘์ด ๊ฐ€๋Šฅํ•ด์ง‘๋‹ˆ๋‹ค. ๐Ÿš€

Recommanded Videos