1. ์๋ฒ ๋ฉ (Embedding) ์ด๋
- ๋จ์ด, ๋ฌธ์ฅ, ์ด๋ฏธ์ง ๋ฑ ์ฌ๋์ด ์ฌ์ฉํ๋ ๋ณต์กํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๊ณ๊ฐ ์ดํดํ ์ ์๋ ์ซ์ ๋ฒกํฐ๋ก ๋ณํํ๋ ๊ณผ์ ๋๋ ๊ทธ ๊ฒฐ๊ณผ๋ฌผ
- ๋ฐ์ดํฐ๋ฅผ ์๋ฒ ๋ฉ ์์ฑ ๋ชจ๋ธ์ ์ ๋ ฅํ๋ฉด ์ผ์ ์์ ์ค์๋ก ๊ตฌ์ฑ๋ ๋ฒกํฐ ์ถ๋ ฅ๋จ.
- ์ฌ๋์ด ์ง์ ๊ด์ฐฐ, ์๋ฏธ ํ์ ํ๊ธฐ๋ ์ด๋ ต์ง๋ง ์ปดํจํฐ๋ “์๋ฒ ๋ฉ” ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ์ฌ “์๋ฏธ์ ์ธ ๊ด๊ณ” ์ดํด ๊ฐ๋ฅ.
- ์ฌ์ค์ ๋ชจ๋ ์ ํ์ ๋ฐ์ดํฐ์ ๋ํ ์๋ฉํฑ ์ ๋ณด๋ฅผ ์ธ์ฝ๋ฉํด์ ๊ณ ์ฐจ์ ๋ฒกํฐ๋ก ๋ํ๋ด๋ ๊ฒ.
2. ์๋ฒ ๋ฉ์ ์ญํ
- ๋จ์ด, ๋ฌธ์ฅ ๊ฐ ์๋ฏธ ๊ด๋ จ๋ ๊ณ์ฐ
- ์๋ก ๋ค๋ฅธ ๋จ์ด์ ๋ฒ์ฃผ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ดํด
- ์๋ฏธ์ , ๋ฌธ๋ฒ์ ์ ๋ณด ํจ์ถ → ๋ฒกํฐ๊ฐ์ด๊ธฐ ๋๋ฌธ์ ์ฌ์น์ฐ์ฐ์ผ๋ก ๋จ์ด๋ค ์ฌ์ด์ ์๋ฏธ, ๋ฌธ๋ฒ์ ๊ด๊ณ ๋์ถ ๊ฐ๋ฅ.
3. ์๋ฒ ๋ฉ ์๋ ๋ฐฉ์
- ๋๋ถ๋ถ์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ ๋ ฅ ๊ฐ : ์ ์ฐจ์์ ์ซ์ ๋ฐ์ดํฐ
- ๋ฐ๋ผ์ ๋ฐ์ดํฐ๋ฅผ ์ซ์๋ก ํํํด์ผ ํ๋ค.
- ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๊ฐ์ฒด ์ ๋ ฅ → ๋ฒกํฐ(์ซ์์ ๋ฐฐ์ด)๋ก ํํ๋๋ ์๋ฒ ๋ฉ์ผ๋ก ์ถ๋ ฅ๋จ.
- ๊ฐ ์ซ์๋ ์ฐจ์์ ๋ฐ๋ผ ๊ฐ์ฒด๊ฐ ์๋ ์์น๋ฅผ ๋ํ๋
- ์ ๋ ฅ ๋ฐ์ดํฐ์ ๋ณต์ก์ฑโฌ, ์ฐจ์์ ์ โฌ (์๋ฐฑ ์์ฒ๊ฐ ์ด์ ๊ฐ๋ฅ)
- ์๋ฒ ๋ฉ ๊ฐ๋ค์ ํด๋น n์ฐจ์ ๊ณต๊ฐ์์ ์๋ก ๊ฐ๊น์ธ์๋ก ์๋ฏธ์ ์ผ๋ก ์ ์ฌํจ
- ์ ์ฌ์ฑ ํ๋จ : ๋ฒกํฐ ์ ์ ๊ธธ์ด๋ก ํ๋จ (์ ํด๋ฆฌ๋, ์ฝ์ฌ์ธ ๋ฑ์ผ๋ก ์ธก์ )
- ์ฐจ์ ์ถ์: ๊ณ ์ฐจ์๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์๋ฒ ๋ฉํ๊ธฐ ์ํด ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์์ ๊ด๋ จ ์๊ฑฐ๋ ์ค๋ณต๋๋ ์ ๋ณด๋ ์ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ์์ถํจ. ์์ฃผ ์ฐ์. (ex. ์คํ ์ธ์ฝ๋, ์ปจ๋ณผ๋ฃจ์ , ์ฃผ์ฑ๋ถ ๋ถ์ ๋ฐ T-๋ถ์ฐ ํ๋ฅ ์ ์ด์ ์๋ฒ ๋ฉ ๋ฑ )
์์
“dad"=[0.1548,0.4848,…,1.864]
“mom"=[0.8785,0.8974,…,2.794]
4. ์๋ฒ ๋ฉ ํ์ฉ
- ํด๋ฌ์คํฐ๋ง
- ๋น๊ต
- ๋ถ๋ฅ ๋ฑ์ ์์ ํจ๊ณผ์ ์ผ๋ก ์ํ ๊ฐ๋ฅ
์ฌ์ฉ ์ฌ๋ก ์์ ์ํฉ : ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ตฌํ ๋ฐฉ๋ฒ
- ๋ชจ๋ ์ฌ์ฉ์์ ํญ๋ชฉ (์ํ, ์ ํ ๋ฑ) ์ ์ฐ์ ๋ฒกํฐ ๊ณต๊ฐ, ์ฆ ์ ์ฌ ๊ณต๊ฐ์์ ๊ณ ์ฐจ์ ๋ฒกํฐ๋ก ํํํ ๋ค ์๋ฒ ๋ฉ์ ์ ๊ณฑ์ ํด๋น ํญ๋ชฉ์ ๋ํ "์ฌ์ฉ์์ ์ ํธ๋"์ ์ฐ๊ด๋๋ ๋ฐฉ์์ผ๋ก ๊ฐ ์ฌ์ฉ์ ๋ฐ ํญ๋ชฉ์ ๋ํ ํํ์ ํ์ตํจ.
- ์ถ์ฒ ์์๋ ํด๋น ์ฌ์ฉ์์ ๋ฒกํฐ์ ์์ง ์ํธ์์ฉํ์ง ์์ ์์ดํ ๋ค์ ๋ฒกํฐ๋ฅผ ๊ฐ๊ฐ ๋ด์ ํ์ฌ, ๊ณ์ฐ๋ ์ ํธ๋ ์์ธก ์ ์๊ฐ ๊ฐ์ฅ ๋์ ์์ดํ ๋ค์ ์ ์ํจ.
*์ ๊ณฑ: ๋ด์ , ๋ ๋ฒกํฐ์์ ํ๋์ ์ค์นผ๋ผ๊ฐ์ ์ป๋ ์ฐ์ฐ
5. ์๋ฒ ๋ฉ์ ์ฌ์ฉํ๋ ์ด์
๊ณ ์ฐจ์ ๋ฐ ๋ฒ์ฃผํ ๋ฐ์ดํฐ๋ฅผ ์ฐ์ ๋ฒกํฐ๋ก ํํํ๊ณ ์๋ฏธ ์๋ ํจํด, ๊ด๊ณ, ์๋ฏธ๋ก ํฌ์ฐฉ ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ ๋ค์ํ ๋๋ฉ์ธ ๋ฐ ์ ํ๋ฆฌ์ผ์ด์ ์์ ์ฌ์ฉ๋๋ ์ถ์ธ.
1) ์๋ฏธ๋ก ์ ํํ: ์๋ฏธ ๊ด๊ณ ๋ฐ ์ ์ฌ์ฑ ํฌ์ฐฉ์ผ๋ก ๋ชจ๋ธ์ด ๋ ์ ์ดํดํ๊ณ ์ผ๋ฐํํ ์ ์๊ฒ ๋์์ค
2) ์ฐจ์ ์ถ์: : ๊ณ ์ฐจ์ ๋ฐ์ดํฐ (์ด๋ฏธ์ง, ํ ์คํธ, ๊ทธ๋ํ ๋ฑ) ๋ฅผ ์ ์ฐจ์ ํํ์ผ๋ก ๋ณํ ๊ฐ๋ฅ
3) ๋ชจ๋ธ ์ผ๋ฐํ: ์๋ฏธ ์๋ ํํ ํ์ต ๋๋ถ์ ์๋ก์ด ์์๋ ์ผ๋ฐํ ๊ฐ๋ฅ.
4) ์ ๊ฒฝ๋ง์ ํจ์จ์ ์ธ ํ์ต: ์ผ๋ฐ์ ์ผ๋ก ์ ๊ฒฝ๋ง ์ํคํ ์ณ์์ ๋ฒ์ฃผํ ์ ๋ ฅ์ ์ฐ์ ๋ฒกํฐ์ ๋งคํํด ์ญ์ ํ ๋ฐ ์ต์ ํ ์ด์ง
์๋ฒ ๋ฉ ์ต์ ๊ธฐ์ ๋ํฅ ์ฐธ๊ณ (2025๋ 9์ ๊ธฐ์ค)
์ฃผ์ ํค์๋ : ๋ฉํฐ๋ชจ๋ฌ ์๋ฒ ๋ฉ, ์ฅ๋ฌธ ์ปจํ ์คํธ ํ๋ช
LLM ์๋ฒ ๋ฉ ๋ชจ๋ธ
LLM ์๋ฒ ๋ฉ ๋ชจ๋ธ ์๋งจํฑ ์ธํ ๋ฆฌ์ ์ค์ ์๋ก์ด ์๋ ํค์๋๋ฅผ ๋์ด ๊ฐ๋ ์ผ๋ก AI ๊ธฐ์ ์ ๋ฐ์ ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ณ ์ดํดํ๋ ๋ฐฉ์์ ๊ทผ๋ณธ์ ์ธ ๋ณํ๋ฅผ ๊ฐ์ ธ์๋ค. ์ด ๋ณํ์ ์ค์ฌ์๋ ๋๊ท๋ชจ
velog.io
6. ์๋ฒ ๋ฉ ๋ชจ๋ธ ์ข ๋ฅ
- Google, OpenAI, Cohere์ ๊ฐ์ ๊ฑฐ๋ ๊ธฐ์ ๋ค์ด ์ ๊ณตํ๋ ๋๊ท๋ชจ API ๊ธฐ๋ฐ์ ๋ ์ ๋ชจ๋ธ → ์ ๋ฃ
- Qwen, NVIDIA, Nomic, BAAI ๋ฑ์ด ์ฃผ๋ํ๋ ์คํ์์ค ๋ชจ๋ธ → ๋ฌด๋ฃ
์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ข ๋ฅ๋ฅผ ์์๋ณด์.
์ฐ์ ์ข ๋ฅ๋ฅผ ์์๋ณด๋ ค๊ณ ๊ฒ์ํด๋ณด๋ ๊ตฌ์กฐ๊ธฐ๋ฐ ๋ถ๋ฅ(์ธ์ฝ๋/๋์ฝ๋), ๋ผ์ด์ ์ค ๊ธฐ๋ฐ ๋ถ๋ฅ, ๊ฐ์ฒด ํ์ ๊ธฐ๋ฐ ๋ถ๋ฅ(๋จ์ด/๋ฌธ๋งฅ/๋ฌธ์ฅ/์ค๋์ค/์ด๋ฏธ์ง ๋ฑ) ๋ถ๋ฅ ๋ฑ๋ฑ ๋ถ๋ฅ ๊ธฐ์ค์ด ๋งค์ฐ ๋ค์ํ๋ค.
์ฐ๋ฆฌ๋ RAG ๊ธฐ๋ฐ LLM ๊ตฌ์ถ์ด ๋ชฉํ์ด๊ธฐ ๋๋ฌธ์ ๋ชจ๋ ๋ถ๋ฅ๊ธฐ์ค์ ์ฝ๋งค์ผ ํ์๋ ์๋ค.
๋ํ ํ๋ก์ ํธ ํน์ฑ์ ์ ์ฝ ์ฌํญ๋ค์ด ๋ช๊ฐ์ง ์๊ธฐ ๋๋ฌธ์ ํจ๊ป ๊ณ ๋ คํ์ฌ ๋ชจ๋ธ์ ์ ์ ํ ๊ฒ์ด๋ค.
๋จ์ด ์๋ฒ ๋ฉ VS ๋ฌธ์ฅ ๋๋ ๋ฌธ์ ์๋ฒ ๋ฉ
๋จ์ด ์๋ฒ ๋ฉ(word embedding): ๋จ์ด๋ค์ ์๋ฏธ, ๋ฌธ๋ฒ์ ์์ฑ, ๊ทธ๋ฆฌ๊ณ ๋ค๋ฅธ ๋จ์ด๋ค๊ณผ์ ๊ด๊ณ๋ฅผ ๋ฐ์ง๋ ๋ฒกํฐ๋ก ํํํ๋ ๋ฐฉ๋ฒ .
๊ฐ ๋จ์ด์ ๋ํด ๊ณ ์ ๋ ๋ฒกํฐ๋ฅผ ์์ฑํ๋ค.
์ฃผ์ ๋ชฉํ๋ ์๋ฏธ ์ฒด๊ณ ๊ด๊ณ์ ๋ฌธ๋งฅ ์ ๋ณด๋ฅผ ์บก์ฒํ๋ ๋ฐฉ์์ผ๋ก ๋จ์ด๋ฅผ ํํํ๋ ๊ฒ์. ๋จ์ด ๊ฐ๊ฐ์ ์๋ฏธ๋ ์์ง๋ง, ๋ฌธ์ฅ ์ ์ฒด์ ๋ฌธ๋งฅ์ ์๋ฏธ๋ฅผ ํ๋์ ๋ฒกํฐ๋ก ํํํ์ง ๋ชปํจ.
ex) Word2Vec, GloVe, FastText
๋ฌธ์ฅ/๋ฌธ๋งฅ ์๋ฒ ๋ฉ(contextual word embedding) : ๋ฌธ์ฅ ๋ด์์ ๋จ์ด์ ์๋ฏธ๋ฅผ ๊ทธ ์ฃผ๋ณ ๋งฅ๋ฝ์ ํตํด ์บก์ฒํ๋ ๋ฐฉ์. ๋จ์ด ์๋ฒ ๋ฉ๊ณผ ๋ค๋ฅด๊ฒ ๋ฌธ๋งฅ์ ๋ฐ๋ผ ๊ฐ ๋จ์ด์ ๋ํ ๋ค๋ฅธ ๋ฒกํฐ๋ฅผ ์์ฑํ๋ค. ๋ฌธ์ฅ์ด๋ ๋ฌธ๋จ ์ ์ฒด์ ์๋ฏธ๋ฅผ ํ๋์ ๋ฒกํฐ๋ก ์์ถํจ. ๋ ์ ํํ ์๋ฏธ ๋ฐ์์ด ๊ฐ๋ฅํ๋ค.
ex) BERT ๊ณ์ด
์ธ์ฝ๋ ๊ธฐ๋ฐ VS ๋์ฝ๋ ๊ธฐ๋ฐ
ํ๋์ ์๋ฒ ๋ฉ ๋ชจ๋ธ๋ค์ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ ๊ตฌ์กฐ (encoder-decoder) ์ ๊ธฐ๋ฐํ์๋ค.
= ์ธ์ฝ๋๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์๋ค์ฌ ์ค์ ์ ๋ณด๋ฅผ ์์ถํ ๊ณ ์ฐจ์ ๋ฒกํฐ๋ก ๋ณํํ๋ฉฐ, ๋์ฝ๋์์๋ ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ต์ข ์ถ๋ ฅ ์์ฑ.
ex) ์ธ์ฝ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ BERT, ๋์ฝ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ GPT
์ธ์ฝ๋๊ธฐ๋ฐ ์๋ฒ ๋ฉ ๋ชจ๋ธ: ๋ฌธ์ฅ ์ ์ฒด์ ๋ฌธ๋งฅ์ "์๋ฐฉํฅ" ์ผ๋ก ์ฝ๊ณ , ๊ทธ ์๋ฏธ๋ฅผ ํ๋ํ๋ ๋ฒกํฐ๋ก ์์ถ(์์ฝ) ํ๋ ๊ฒ์ ์ต์ ํ ๋จ.
์ฃผ์ํ๋: ์๋ฒ ๋ฉ ์์ฑ, ํ ์คํธ ๋ถ๋ฅ, ์ง๋ฌธ-์๋ต, ๊ฐ์ ๋ถ์ ๋ฑ.
ex) BERT ๋ฑ
๋์ฝ๋ ๊ธฐ๋ฐ ์๋ฒ ๋ฉ ๋ชจ๋ธ: ๊ธฐ๋ณธ์ ์ธ ์ญํ ์ ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ์์ธกํ์ฌ ํ ์คํธ๋ฅผ ์์ฑํ๋ ๊ฒ. ๋ค์ ๋จ์ด๋ฅผ ์ ์์ธกํ๋ค๋ ๊ฒ์ ์์ ํ ์คํธ์ ๋ฌธ๋งฅ์ ์ ์ดํดํ๋ค๋ ๋ป์ด๋ฉฐ ์ด์ ์๋ฏธ ๋ฒกํฐ๋ฅผ ๋ฝ์๋ด๋ ์ญํ ๋ ํจ.
ex) GPT, OpenAI์ text-embedding-ada-002 ๋ฑ.
๋ฐ์ดํฐ ์ข ๋ฅ์ ๋ฐ๋ฅธ ์๋ฒ ๋ฉ ๋ชจ๋ธ ๋ถ๋ฅ
1. ํ ์คํธ ์๋ฒ ๋ฉ (Text Embedding)
- ์ง๊ธ๊น์ง ์ฐ๋ฆฌ๊ฐ ์ด์ผ๊ธฐํ๋ ๋ถ์ผ์ ๋๋ค. ๋จ์ด, ๋ฌธ์ฅ, ๋ฌธ์ ๊ฐ์ ์์ฐ์ด๋ฅผ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ๋ชฉํ: ์๋ฏธ์ , ๋ฌธ๋งฅ์ ์ ์ฌ์ฑ์ ๋ฒกํฐ ๊ณต๊ฐ์ ๊ฑฐ๋ฆฌ๋ก ํํํฉ๋๋ค.
- ์ฃผ์ ๋ชจ๋ธ: Word2Vec, GloVe, BERT, RoBERTa, GPT ๋ฑ
2. ์ด๋ฏธ์ง ์๋ฒ ๋ฉ (Image Embedding)
- ์ด๋ฏธ์ง๋ ์ฌ์ง์ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ๋ชฉํ: ์ด๋ฏธ์ง์ ์๊ฐ์ ํน์ง(๊ฐ์ฒด, ์์, ์คํ์ผ ๋ฑ)์ ํฌ์ฐฉํ์ฌ, ๋น์ทํ ์ด๋ฏธ์ง๋ ๋ฒกํฐ ๊ณต๊ฐ์์ ๊ฐ๊น๊ฒ ์์น์ํต๋๋ค.
- ํ์ฉ: '์ด๋ฏธ์ง๋ก ์ด๋ฏธ์ง ๊ฒ์', ๋น์ทํ ์ํ ์ถ์ฒ, ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฑ์ ์ฌ์ฉ๋ฉ๋๋ค.
- ์ฃผ์ ๋ชจ๋ธ: ResNet, VGG, Vision Transformer (ViT) ๋ฑ
3. ์ค๋์ค ์๋ฒ ๋ฉ (Audio Embedding)
- ์์ , ์์ฑ ๊ฐ์ ์๋ฆฌ ๋ฐ์ดํฐ๋ฅผ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ๋ชฉํ: ์๋ฆฌ์ ํน์ง(์์, ๋ฆฌ๋ฌ, ๋ฉ๋ก๋, ํ์์ ๋ชฉ์๋ฆฌ ํค ๋ฑ)์ ๋ฒกํฐ๋ก ํํํฉ๋๋ค.
- ํ์ฉ: ๋น์ทํ ๋ถ์๊ธฐ์ ์์ ์ถ์ฒ, ์์ฑ ์ธ์, ํ์ ์๋ณ ๋ฑ์ ์ฌ์ฉ๋ฉ๋๋ค.
- ์ฃผ์ ๋ชจ๋ธ: VGGish, SoundNet, Wav2Vec ๋ฑ
4. ๊ทธ๋ํ ์๋ฒ ๋ฉ (Graph Embedding)
- ์์ ๋คํธ์ํฌ, ๋ถ์ ๊ตฌ์กฐ์ฒ๋ผ ๋ ธ๋(์ )์ ์ฃ์ง(์ )๋ก ์ฐ๊ฒฐ๋ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฅผ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ๋ชฉํ: ๋คํธ์ํฌ ๋ด์์ ๊ฐ ๋ ธ๋์ ๊ด๊ณ์ , ๊ตฌ์กฐ์ ์ญํ ์ ๋ฒกํฐ๋ก ํํํฉ๋๋ค.
- ํ์ฉ: ์์ ๋ฏธ๋์ด ์น๊ตฌ ์ถ์ฒ, ๋จ๋ฐฑ์ง ์ํธ์์ฉ ์์ธก, ์ ์ฝ ๊ฐ๋ฐ ๋ฑ์ ์ฌ์ฉ๋ฉ๋๋ค.
- ์ฃผ์ ๋ชจ๋ธ: Node2Vec, DeepWalk ๋ฑ
7. ์๋ฒ ๋ฉ ๋ชจ๋ธ ์ ์ ์ ๊ณ ๋ ค ํด์ผ ํ๋ ๋ถ๋ถ ๋ฐ ํ๋ณด ๋ชจ๋ธ ๋ชฉ๋ก
๋จผ์ ์ฐ๋ฆฌํ์ ์๊ตฌ์ฌํญ ๋ชฉ๋ก์ด๋ค.
์๋ 3๊ฐ์ง๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ถฉ์กฑ๋์ด์ผ ํ๋ ์กฐ๊ฑด๋ค์ด๋ค. ์ฐ๋ฆฌ์ ์๋ฒ ๋ฉ ๋ชจ๋ธ ์ฌ์ฉ ๋ชฉ์ ์ RAG ๊ธฐ๋ฐ LLM ๊ตฌ์ถ์ ์๊ธฐ ๋๋ฌธ์ RAG ์ ๋ง๋ค ๋์ ์ต๊ณ ์ ์ฑ๋ฅ์ ๋ผ ์ ์๋ ๋ชจ๋ธ์ ์ฐพ๊ณ ์ ํ๋ค.
์ดํ ์๋ ๋ค๊ฐ๋ (4๊ฐ์ง) ์ฌ์ฉ๊ฐ๋ฅ ํ ๋ชจ๋ธ์ ๋๊ณ ํ๋์ฉ ๋น๊ตํด๋ณผ ์์ ์ด๋ค.
1. ๋ฌด๋ฃ
2. ์์ ์ ํ ์๋ ๋ผ์ด์ ์ค
3. ํ๊ตญ์ด ์ฑ๋ฅ ์ฐ์
4. RAG ์ ์ ํฉ → RAG์ ํต์ฌ์ '๊ฒ์(Retrieval)' ์ฑ๋ฅ
5. ๋ชจ๋ธ ํฌ๊ธฐ
6. ๋ฒกํฐ ์ฐจ์์ → ๋ฒกํฐDB ์ ๊ท๊ฒฉ ๋ง์์ผ ํจ.
7. ์ฐ์ฐ์๋ → ๋๋ถ๋ถ ๋งค์ฐ ๋น ๋ฆ . .
8. ์์
๋จผ์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ํ๋์ ๋น๊ตํด๋ณผ์ ์๋ ๋ฒค์น๋งํฌ ์ด๋ค.
MTEB Leaderboard - a Hugging Face Space by mteb
huggingface.co
MTEB(Massive Text Embedding Benchmark) ๋?
- ํ ์คํธ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ค์ํ ๊ด์ ์์ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํ๊ณ ๋น๊ตํ๊ธฐ ์ํด ๋ง๋ค์ด์ง ํ์คํ๋ ํ๋ ์์ํฌ.
- ๋ฌธ์ฅ๊ณผ ๋ฌธ์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋น๊ตํ ์ ์๋ ๋ฆฌ๋๋ณด๋๊ฐ ์กด์ฌํ๋ค.
- ๊ฒ์, ํด๋ฌ์คํฐ๋ง, ๋ถ๋ฅ, ์๋ฏธ์ ์ ์ฌ๋ ๋ฑ ์ฌ๋ฌ ํ์คํฌ๋ก ๋๋ ๋ชจ๋ธ์ ์๋ฒ ๋ฉ ์ฑ๋ฅ ํ๊ฐํ๋ค.
- ํน์ ์์ (์: ๊ฒ์)๋ง ์ํ๋ ๋ชจ๋ธ์ด ์๋๋ผ, ์ฌ๋ฌ ์ข ๋ฅ์ ์ธ์ด ๊ณผ์ ์์ ๋๋ฃจ ์ข์ ์ฑ๋ฅ์ ๋ด๋์ง ๊ฐ๊ด์ ์ผ๋ก ํ๊ฐํ๋ ๊ฒ์ ๋ชฉํ๋ก ํจ.
- ๊ณผ๊ฑฐ์๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ๊ฐ๊ธฐ ๋ค๋ฅธ ๊ธฐ์ค์ผ๋ก ํ๊ฐํ์ง๋ง, MTEB๋ ์ด๋ฅผ ํ๋๋ก ํตํฉํ์ฌ ๊ฐ๋ฐ์๋ค์ด ๋ชจ๋ธ์ ๊ฐ์ ๊ณผ ์ฝ์ ์ ํ๋์ ํ์ ํ๊ณ ๊ณต์ ํ๊ฒ ๋น๊ตํ ์ ์๋๋ก ๋์ต๋๋ค.
ex) ์๋ฏธ๋ก ์ ํ ์คํธ ์ ์ฌ๋(STS) ์์ ์ต๊ณ ์ฑ๋ฅ์ ๋ณด์ด๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ด ํด๋ฌ์คํฐ๋ง์ด๋ ์ฌ์ ๋ ฌ(reranking) ๊ฐ์ ๋ค๋ฅธ ์์ ์์๋ ๋๊ฐ์ด ๋ฐ์ด๋ ์ง๋ ๋ถ๋ถ๋ช ํจ.
์ ์ฑ๋ฅ ๋ณด์ฅ์ด ์๋๋๊ฐ? = ํ์คํฌ๋ณ๋ก ์๊ตฌํ๋ '์ ์ฌ๋'์ ์ ์๊ฐ ๋ค๋ฅด๊ธฐ ๋๋ฌธ"
| ํ์คํฌ | ๋ชฉํ | ํ์ํ '์ ์ฌ๋'์ ์ ์ |
| STS | ๋ ํ ์คํธ์ ์๋ฏธ์ ์ผ์น๋ ์ธก์ | 1:1 ๋น๊ต, ๋์นญ์ ์ ์ฌ์ฑ |
| ํด๋ฌ์คํฐ๋ง | ์ ์ฒด ๋ฐ์ดํฐ์ ๊ตฌ์กฐ์ ๊ทธ๋ฃนํ | ๊ทธ๋ฃน ๋ด์ ์์ง๋, ์ ์ญ์ (Global) ์ ์ฌ์ฑ |
| ๊ฒ์/์ฌ์ ๋ ฌ | ์ง๋ฌธ์ ๋ํ ์ต์ ์ ์ ๋ต ์์ ๋งค๊ธฐ๊ธฐ | ์ง๋ฌธ-๋ต๋ณ ๊ด๊ณ, ๋น๋์นญ์ ๊ด๋ จ์ฑ(Relevance) |
MTEB ์ ํ๊ฐ ๋ฐฉ๋ฒ

MTEB๊ฐ ๋ฏธ๋ฆฌ ์ค๋นํด ๋ ๋ฐ์ดํฐ์ ์ ํ์ฉํด ๊ฐ ํ์คํฌ(๊ฒ์, ๋ถ๋ฅ, ํด๋ฌ์คํฐ๋ง, STS) ๋ง๋ค ๋งค์ฐ ๊ตฌ์ฒด์ ์ด๊ณ ์๋ํ๋ ํ๊ฐ ์ ์ฐจ ๋ฐ๋ฆ.
MTEB ์์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์ : arXiv, bioRxiv (๊ณผํ ๊ธฐ์ ๋ ผ๋ฌธ), Amazon (์ํ ๋ฆฌ๋ทฐ, Alexa ๋ช ๋ น์ด), Twitter, Stack Overflow (๊ฐ๋ฐ์ Q&A), MS MARCO(Bing ๊ฒ์์์ง ์ค์ ๋ฐ์ดํฐ) ๋ฑ (์ถ์ฒ: MTEB ๋ ผ๋ฌธ )
๊ฐ ํ์คํฌ๋ณ ํ๊ฐ ๋ด์ฉ
๐ ๊ฒ์ (Retrieval)
- ๋ชฉํ: ์ง๋ฌธ(query)์ ๊ฐ์ฅ ์ ํฉํ ๋ฌธ์(document)๋ฅผ ์ฐพ์๋ด๋ ๋ฅ๋ ฅ ํ๊ฐ
- ํ๊ฐ ๊ณผ์ :
- MTEB๊ฐ ๋ฏธ๋ฆฌ ์ค๋นํด ๋ ์๋ง์ ๋ฌธ์(Corpus)์ ์ง๋ฌธ(Queries) ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํฉ๋๋ค. (๊ฐ ์ง๋ฌธ์ ๋ํ ์ ๋ต ๋ฌธ์๋ ์ด๋ฏธ ์ง์ ๋์ด ์์ต๋๋ค.)
- ํ ์คํธํ ์๋ฒ ๋ฉ ๋ชจ๋ธ๋ก ๋ชจ๋ ๋ฌธ์์ ์ง๋ฌธ์ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ๊ฐ ์ง๋ฌธ ๋ฒกํฐ์ ์ฝ์ฌ์ธ ์ ์ฌ๋๊ฐ ๊ฐ์ฅ ๋์ ๋ฌธ์ ๋ฒกํฐ ์์๋๋ก ๋ญํน์ ๋งค๊น๋๋ค.
- ์ด ๋ญํน ๊ฒฐ๊ณผ๊ฐ ์ค์ ์ ๋ต๊ณผ ์ผ๋ง๋ ์ผ์นํ๋์ง ์ ์๋ฅผ ๋งค๊น๋๋ค.
- ํต์ฌ ํ๊ฐ์งํ (Main Metric): nDCG@10
- ์๋ฏธ: ์์ 10๊ฐ ๊ฒ์ ๊ฒฐ๊ณผ์ '์์'๊น์ง ๊ณ ๋ คํ ์ ํ๋์ ๋๋ค. ๋จ์ํ ์ ๋ต์ 10๊ฐ ์์ ํฌํจ์์ผฐ๋์ง ๋ฟ๋ง ์๋๋ผ, ๊ฐ์ฅ ์ค์ํ ์ ๋ต์ ๊ฐ์ฅ ๋์ ์์(1~2์)์ ์ฌ๋ ธ๋์ง๋ฅผ ๋น์ค ์๊ฒ ํ๊ฐํฉ๋๋ค. RAG ์ฑ๋ฅ์ ๊ฐ์ฅ ์ด์์ ์ธ ์งํ ์ค ํ๋์ ๋๋ค.
๐ ๋ถ๋ฅ (Classification)
- ๋ชฉํ: ํ ์คํธ๋ฅผ ์ฃผ์ด์ง ์นดํ ๊ณ ๋ฆฌ๋ก ๋๋๋ ๋ฅ๋ ฅ ํ๊ฐ (์: ์ํ ๋ฆฌ๋ทฐ๋ฅผ '๊ธ์ '/'๋ถ์ '์ผ๋ก ๋ถ๋ฅ)
- ํ๊ฐ ๊ณผ์ :
- ์ฃผ์ด์ง ํ ์คํธ๋ค์ ๋ชจ๋ธ์ ์ฌ์ฉํด ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ์ด ๋ฒกํฐ๋ค์ ๊ฐ์ง๊ณ ๊ฐ๋จํ ๋จธ์ ๋ฌ๋ ๋ถ๋ฅ๊ธฐ(๋ก์ง์คํฑ ํ๊ท)๋ฅผ ํ์ต์ํต๋๋ค.
- ํ์ต๋ ๋ถ๋ฅ๊ธฐ๊ฐ ํ ์คํธ์ฉ ํ ์คํธ๋ค์ ์ผ๋ง๋ ์ ํํ๊ฒ ๋ถ๋ฅํ๋์ง ํ์ธํฉ๋๋ค.
- ํต์ฌ ํ๊ฐ์งํ (Main Metric): Accuracy (์ ํ๋)
๐งฉ ํด๋ฌ์คํฐ๋ง (Clustering)
- ๋ชฉํ: ๋น์ทํ ์ฃผ์ ์ ํ ์คํธ๋ผ๋ฆฌ ๊ทธ๋ฃน์ผ๋ก ๋ฌถ๋ ๋ฅ๋ ฅ ํ๊ฐ
- ํ๊ฐ ๊ณผ์ :
- ๋ชจ๋ ํ ์คํธ๋ฅผ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- K-ํ๊ท (k-means)๊ณผ ๊ฐ์ ํ์ค ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๋ฒกํฐ๋ค์ ๊ทธ๋ฃน์ผ๋ก ๋๋๋๋ค.
- ์๊ณ ๋ฆฌ์ฆ์ด ๋ง๋ ๊ทธ๋ฃน์ด ์ค์ ์ ๋ต ๊ทธ๋ฃน๊ณผ ์ผ๋ง๋ ์ผ์นํ๋์ง ์ ์๋ฅผ ๋งค๊น๋๋ค.
- ํต์ฌ ํ๊ฐ์งํ (Main Metric): v-measure
โ๏ธ ์๋ฏธ๋ก ์ ํ ์คํธ ์ ์ฌ๋ (STS)
- ๋ชฉํ: ๋ ๋ฌธ์ฅ์ด ์๋ฏธ์ ์ผ๋ก ์ผ๋ง๋ ๋น์ทํ์ง ์ธก์ ํ๋ ๋ฅ๋ ฅ ํ๊ฐ
- ํ๊ฐ ๊ณผ์ :
- ๋ ๋ฌธ์ฅ์ ๊ฐ๊ฐ ๋ฒกํฐ๋ก ๋ณํํฉ๋๋ค.
- ๋ ๋ฒกํฐ ๊ฐ์ ์ฝ์ฌ์ธ ์ ์ฌ๋๋ฅผ ๊ณ์ฐํฉ๋๋ค.
- ์ด ๊ณ์ฐ๋ ์ ์ฌ๋ ์ ์๊ฐ ์ฌ๋์ด ์ง์ ๋งค๊ธด ์ค์ ์ ์ฌ๋ ์ ์์ ์ผ๋ง๋ ์ ์ฌํ ๊ฒฝํฅ์ ๋ณด์ด๋์ง(์๊ด๊ด๊ณ)๋ฅผ ์ธก์ ํฉ๋๋ค.
- ํต์ฌ ํ๊ฐ์งํ (Main Metric): Spearman correlation (์คํผ์ด๋ง ์๊ด๊ณ์)
MTEB ๋ก ์๋ฒ ๋ฉ ๋ชจ๋ธ ์์ ํ์ธํ๊ธฐ
RAG ์ ๊ตฌ์ถํ๋ ๋ฐ์ ์์ด์ ์ ํฉํ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฐพ๊ธฐ ์ํด ์๋์ ๊ฐ์ด ์ธํ ํด๋ณด์๋ค.

Task Type: Retrieval (๊ฒ์) : RAG์ ํต์ฌ
Doman: Non-fiction : ์ฐ๋ฆฌ ํ๋ก์ ํธ์ ๋ชฉํ๋ "์ผ์ ๋ํ" ์ด๊ธฐ ๋๋ฌธ์ ํน์ ๋๋ฉ์ธ์ด ์๋ ๋ฒ์ฉ์ฑ์ ์ถ๊ตฌํ๊ธฐ ์ํจ.
Modality : text
Language : Kor
Task : KLUE-STS, Ko-StrategyQA, KorSTS, MIRACLRetrieval
KLUE-STS (Korean Language Understanding Evaluation - Semantic Textual Similarity )
- ํ๊ตญ์ด ์ดํด ๋ฅ๋ ฅ ํ๊ฐ๋ฅผ ์ํ ๋ํ์ ์ธ ์ข ํฉ ๋ฒค์น๋งํฌ 'KLUE'**์ ํฌํจ๋, ๋ฌธ์ฅ ์ ์ฌ๋ ์ธก์ ์ํ
Ko-StrategyQA (Korean Strategy Question Answering )
- ์ฌ๋ฌ ๋จ๊ณ์ ์ถ๋ก ์ด ํ์ํ ๋ณต์กํ ์ง๋ฌธ-๋ต๋ณ(QA) ๋ฐ์ดํฐ์ ์ ํ๊ตญ์ด ๋ฒ์
KorSTS (Korean Semantic Textual Similarity)
- KLUE-STS์ ๋์ผํ๊ฒ ๋ ๋ฌธ์ฅ ๊ฐ์ ์๋ฏธ์ ์ ์ฌ๋๋ฅผ ํ๊ฐ
- ์๋ก ๋ค๋ฅธ ์ถ์ฒ์ ๋ฐ์ดํฐ๋ก ๊ตฌ์ฑ๋์ด ์์ด, ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ๊ต์ฐจ ๊ฒ์ฆํ๋ ์ญํ
MIRACLRetrieval (Multilingual Information Retrieval Across Corpus & Languages)
- 18๊ฐ์ ๋ค์ํ ์ธ์ด์ ๋ํด ์ ๋ณด ๊ฒ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๋๊ท๋ชจ ๋ค๊ตญ์ด ๊ฒ์ ๋ฒค์น๋งํฌ
MTEB ์์
๊ฒฐ๋ก ์ ์ผ๋ก ์ ํํฐ๋ง์ ๊ฑฐ์น ๋ชจ๋ธ ๋ชฉ๋ก์ ์๋์ ๊ฐ๋ค.
- PwC-Embedding_expr
- jina-embeddings-v3
- multilingual-e5-large-instruct
- snowflake-arctic-embed-l-v2.0
- Solon-embeddings-large-0.1
- gte-multilingual-base
- STS-multilingual-mpnet-base-v2
- bilingual-embedding-base
- multilingual-e5-base
- Arabic-all-nli-triplet-Matryoshka
์ด ์ค์์, ํ๊ตญ์ด ์ง์ ์ฌ๋ถ, ๋ผ์ด์ ์ค ์ฌ๋ถ ๋ฑ์ ๋ฐ์ ธ์ ์ฌ์ฉ ๋ถ๊ฐ๋ฅํ ๋ชจ๋ธ์ ๊ฑธ๋ฌ๋ธ ์ต์ข ๋ชจ๋ธ 3๊ฐ์ง๋ ์๋์ ๊ฐ๋ค.
1. snowflake-arctic-embed-l-v2.0
https://huggingface.co/Snowflake/snowflake-arctic-embed-l-v2.0
Snowflake/snowflake-arctic-embed-l-v2.0 · Hugging Face
Snowflake's Arctic-embed-l-v2.0 News Models Snowflake arctic-embed-l-v2.0 is the newest addition to the suite of embedding models Snowflake has released optimizing for retrieval performance and inference efficiency. Arctic Embed 2.0 introduces a new standa
huggingface.co
2. multilingual-e5-large-instruct
https://huggingface.co/intfloat/multilingual-e5-large-instruct
intfloat/multilingual-e5-large-instruct · Hugging Face
Multilingual-E5-large-instruct Multilingual E5 Text Embeddings: A Technical Report. Liang Wang, Nan Yang, Xiaolong Huang, Linjun Yang, Rangan Majumder, Furu Wei, arXiv 2024 This model has 24 layers and the embedding size is 1024. Usage Below are examples t
huggingface.co
3. PwC-Embedding_expr
https://huggingface.co/SamilPwC-AXNode-GenAI/PwC-Embedding_expr
SamilPwC-AXNode-GenAI/PwC-Embedding_expr · Hugging Face
huggingface.co
+ ํ๊ตญ์ด ํนํ ๋ชจ๋ธ ์ถ๊ฐ
์๋ ์ฃผ์๋ ํ๊ตญ์ด ํนํ๋ ์คํ์์ค ์๋ฒ ๋ฉ ๋ชจ๋ธ ์์๋ฅผ ํ์ธํด๋ณผ์ ์๋ ๋ฆฌ๋๋ณด๋์ด๋ค.
MTEB ๋ฅผ ์ปค์คํ ํด์ ์ ์๋ ์ฌ์ดํธ์ด๋ฉฐ MTEB ์์ ๋ฐ๊ฒฌํ์ง ๋ชปํ๋ ํ๊ตญ์ด ๋ชจ๋ธ์ ๋ฐ๊ฒฌํ๋ค
https://github.com/OnAnd0n/ko-embedding-leaderboard
GitHub - OnAnd0n/ko-embedding-leaderboard: Korean-MTEB
Korean-MTEB. Contribute to OnAnd0n/ko-embedding-leaderboard development by creating an account on GitHub.
github.com
๊ทธ ์ค ๋ด๊ฐ ์ต์ข ์ ์ผ๋ก ์ ์ ํ๋ ์ธ๊ฐ์ง ๋ชจ๋ธ๊ณผ ๋น์ทํ ์ ์๋ฅผ ์ป์ ์๋ ๋๊ฐ์ ๋ชจ๋ธ์ ๊ฐ์ด ๋น๊ตํด ๋ณด๊ณ ์ ํ๋ค.
1. dragonkue/snowflake-arctic-embed-l-v2.0-ko
https://huggingface.co/dragonkue/snowflake-arctic-embed-l-v2.0-ko
dragonkue/snowflake-arctic-embed-l-v2.0-ko · Hugging Face
SentenceTransformer based on Snowflake/snowflake-arctic-embed-l-v2.0 This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-l-v2.0 on the clustered datasets. It maps sentences & paragraphs to a 1024-dimensional dense vector s
huggingface.co
2. nlpai-lab/KURE-v1
https://huggingface.co/nlpai-lab/KURE-v1
nlpai-lab/KURE-v1 · Hugging Face
๐ KURE-v1 Introducing Korea University Retrieval Embedding model, KURE-v1 It has shown remarkable performance in Korean text retrieval, speficially overwhelming most multilingual embedding models. To our knowledge, It is one of the best publicly opened
huggingface.co
RAG ์๋ฒ ๋ฉ ๋ชจ๋ธ ์ต์ข ํ๋ณด ๋น๊ต
| ๊ตฌ๋ถ | snowflake-arctic-embed-l-v2.0 | multilingual-e5-large-instruct | PwC-Embedding_expr | dragonkue/snowflake-arctic-embed-l-v2.0-ko | nlpai-lab/KURE-v1 |
| ๋ฆด๋ฆฌ์ฆ | 24๋ 12์ | 24๋ | 25๋ 8์ | 25๋ 3์ | 24๋ 12์ |
| ์๊ธ | ๋ฌด๋ฃ | ๋ฌด๋ฃ | ๋ฌด๋ฃ | ๋ฌด๋ฃ | ๋ฌด๋ฃ |
| ๋ผ์ด์ ์ค | Apache 2.0 | MIT | Apache 2.0 | Apache 2.0 | MIT |
| ์ง์ ์ธ์ด | O / ๋ค๊ตญ์ด๋ชจ๋ธ | O / ๋ค๊ตญ์ด๋ชจ๋ธ | O / ํ๊ตญ์ด ํนํ | O / ํ๊ตญ์ด ํนํ | O / ํ๊ตญ์ด ํนํ |
| ๋ชจ๋ธ ํฌ๊ธฐ | 568M | 560M | 560M | 568M | 568M |
| ํ์ผ ํฌ๊ธฐ | 2.27GB | 1.12GB | 2.4GB | 2.27 GB | 2.27 GB |
| ๋ฒกํฐ ์ฐจ์ ์ | 1024 | 1024 | 1024 | 1024 | 1024 |
| CPU ์ฌ์ฉ์ฑ | ๋๋ฆด ์ ์์ | ์๋์ ์ผ๋ก ๊ฐ์ฅ ์ํธ | ๋๋ฆด ์ ์์ | ๋๋ฆด ์ ์์ | ๋๋ฆด ์ ์์ |
| Retrieval ๊ฒ์ ์ ์ |
80.45 (1์) | 80.35 (2์) | 79.69 (3์) | 78.13 | 75.67 |
8. ์๋ฒ ๋ฉ ๋ชจ๋ธ ํ ์คํธ
- ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋ชฉํ๋ "์๋ฏธ ์๋ ๊ด๊ณ๊ฐ ๋ณด์กด"๋๋ ์ฐ์ ๋ฒกํฐ ๊ณต๊ฐ์์ ๋ฐ์ดํฐ๋ฅผ ํํํ๋ ๊ฒ.
- ์ค์ ๋ก ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ํ์ต ํ๋ก์ธ์ค์๋ ์ ํํ ๋ชฉ์ ํจ์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ ๊ฐ์ ์ฐจ์ด๋ฅผ ์ต์ํํ๊ธฐ ์ํด ๋ชจ๋ธ์ ๋งค๊ฐ๋ณ์๋ฅผ ์กฐ์ ํ๋ ์์ ์ด ํฌํจ๋๋ค.
ํ ์คํธ ํ๊ฒฝ
1. LLM ๋ชจ๋ธ
์ฐ์ llm ๋ชจ๋ธ์ K-intelligence/Midm-2.0-Mini-Instruct
vllm ์ ์๋นํด๋๊ณ ํ ์คํธ ํ๋ค.
2. ํ ์คํธ ๋ฐ์ดํฐ
#1
#๋ฐ์ดํฐ ์์ค
CORPUS = [
"PwC-Embedding_expr ๋ชจ๋ธ์ multilingual-e5-large-instruct๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๊ตญ์ด STS ๋ฐ์ดํฐ์
์ ์ฆ๊ฐํ์ฌ ๋ฏธ์ธ์กฐ์ ํ ๋ชจ๋ธ์ด๋ค.",
"multilingual-e5-large-instruct ๋ชจ๋ธ์ MIT ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฅด๋ฉฐ, ํ์ผ ํฌ๊ธฐ๋ 1.12GB์ด๋ค.",
"snowflake-arctic-embed-l-v2.0 ๋ชจ๋ธ์ ์ต๋ ํ ํฐ ๊ธธ์ด๋ 8192์ด๋ฉฐ, ๋ฒกํฐ ์ฐจ์ ์๋ 1024์ด๋ค.",
"RAG ์์คํ
์์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฒ์(Retrieval) ์ ํ๋์ ํฐ ์ํฅ์ ๋ฏธ์น๋ค.",
"CPU์์ ๋์ฉ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์คํํ ๊ฒฝ์ฐ, ์๋ต ์๋๊ฐ ์๋นํ ๋๋ ค์ง ์ ์๋ค."
]
#ํ ์คํธ ์ง๋ฌธ
QUESTIONS = [
"PwC ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ด๋ค ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก๋์?",
"CPU์์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋๋ฆฌ๋ฉด ์ด๋ป๊ฒ ๋๋์?",
"e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋ ๋ฌด์์ธ๊ฐ์?",
"๊ฐ์ฅ ๊ธด ํ
์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ์ ๋ฌด์์ธ๊ฐ์?"
]
์์ ์๊ฐ ๊ฒฐ๊ณผ
| ๋ชจ๋ธ ์ด๋ฆ | ๋ฒกํฐ DB ์์ฑ ์๊ฐ (์ด) (๋ฌธ์ ์๋ฒ ๋ฉ ์๋) |
์ง๋ฌธ๋น ํ๊ท ๋ต๋ณ ์์ฑ ์๊ฐ (์ด) (์ฌ์ฉ์ ์ฒด๊ฐ ์๋) |
๋ต๋ณ ํ์ง |
| multilingual-e5-large-instruct | 0.20 | 0.30 | ๋งค์ฐ ์ฐ์ |
| SamilPwC-AXNode-GenAI/PwC-Embedding_expr | 0.21 | 0.29 | ์ฐ์ (๊ฐ๊ฒฐ) |
| dragonkue/snowflake-arctic-embed-l-v2.0-ko | 0.21 | 0.29 | ์ฐ์ (๊ฐ๊ฒฐ) |
| nlpai-lab/KURE-v1 | 0.21 | 0.43 | ๋งค์ฐ ์ฐ์ (์์ธ) |
| Snowflake/snowflake-arctic-embed-l-v2.0 | 0.27 | 0.43 | ๋งค์ฐ ์ฐ์ (์์ธ) |
# 1 ๋ชจ๋ธ๋ณ ๋ต๋ณ ๋น๊ต
| ์ง๋ฌธ (Question) | Snowflake ์๋ณธ | e5-large-instruct | PwC-expr | dragonkue-ko | KURE-v1 |
| PwC ๋ชจ๋ธ์ ๊ธฐ๋ฐ์? | PwC ์๋ฒ ๋ฉ ๋ชจ๋ธ์ multilingual-e5-large-instruct ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. ์ด ๋ชจ๋ธ์ ํ๊ตญ์ด STS ๋ฐ์ดํฐ์ ์ ์ฆ๊ฐํ์ฌ ๋ฏธ์ธ์กฐ์ ๋ ๊ฒ์ ๋๋ค. | PwC ์๋ฒ ๋ฉ ๋ชจ๋ธ์ multilingual-e5-large-instruct ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. | PwC ์๋ฒ ๋ฉ ๋ชจ๋ธ์ multilingual-e5-large-instruct ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. | PwC ์๋ฒ ๋ฉ ๋ชจ๋ธ์ multilingual-e5-large-instruct ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. | PwC ์๋ฒ ๋ฉ ๋ชจ๋ธ์ multilingual-e5-large-instruct ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. |
| CPU์์ ๋๋ฆฌ๋ฉด? | # CPU์์ ์๋ฒ ๋ฉ ๋ชจ๋ธ ์คํ ์ ์ฑ๋ฅ ๋ฌธ์ CPU์์ ๋์ฉ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์คํํ ๊ฒฝ์ฐ, ์๋ต ์๋๊ฐ ์๋นํ ๋๋ ค์ง ์ ์์ต๋๋ค. ์ด๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ด ์ผ๋ฐ์ ์ผ๋ก GPU์ ๊ฐ์ ์ ์ฉ ํ๋์จ์ด์์ ๋ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌ๋๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด, ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฒ์(Retrieval) ์ ํ๋์ ํฐ ์ํฅ์ ๋ฏธ์น๋ฏ๋ก, CPU ํ๊ฒฝ์์๋ ์ด๋ฌํ ๋ชจ๋ธ์ ์ฌ์ฉํ ๋ ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. | CPU์์ ๋์ฉ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์คํํ ๊ฒฝ์ฐ, ์๋ต ์๋๊ฐ ์๋นํ ๋๋ ค์ง ์ ์์ต๋๋ค. | CPU์์ ๋์ฉ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์คํํ ๊ฒฝ์ฐ, ์๋ต ์๋๊ฐ ์๋นํ ๋๋ ค์ง ์ ์์ต๋๋ค. | CPU์์ ๋์ฉ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์คํํ ๊ฒฝ์ฐ, ์๋ต ์๋๊ฐ ์๋นํ ๋๋ ค์ง ์ ์์ต๋๋ค. | # CPU์์ ์๋ฒ ๋ฉ ๋ชจ๋ธ ์คํ ์ ์ฑ๋ฅ ๋ฌธ์ CPU์์ ๋์ฉ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์คํํ ๊ฒฝ์ฐ, ์๋ต ์๋๊ฐ ์๋นํ ๋๋ ค์ง ์ ์์ต๋๋ค. ์ด๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ด ์ผ๋ฐ์ ์ผ๋ก GPU์์ ๋ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌ๋๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด, ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฒ์(Retrieval) ์ ํ๋์ ํฐ ์ํฅ์ ๋ฏธ์น๋ฏ๋ก, CPU ํ๊ฒฝ์์๋ ์ด๋ฌํ ๋ชจ๋ธ์ ์ฌ์ฉํ ๋ ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. |
| e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋? | e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋ MIT ๋ผ์ด์ ์ค์ ๋๋ค. | e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋ MIT ๋ผ์ด์ ์ค์ ๋๋ค. | e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋ MIT ๋ผ์ด์ ์ค์ ๋๋ค. | e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋ MIT ๋ผ์ด์ ์ค์ ๋๋ค. | e5 ๋ชจ๋ธ์ ๋ผ์ด์ ์ค๋ MIT ๋ผ์ด์ ์ค์ ๋๋ค. |
| ๊ฐ์ฅ ๊ธด ํ ์คํธ ์ฒ๋ฆฌ ๋ชจ๋ธ์? | ๊ฐ์ฅ ๊ธด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ์ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ชจ๋ธ์ ์ต๋ ํ ํฐ ๊ธธ์ด๋ 8192์ด๋ฉฐ, ๋ฒกํฐ ์ฐจ์ ์๋ 1024์ ๋๋ค. | ๊ฐ์ฅ ๊ธด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ์ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ชจ๋ธ์ ์ต๋ ํ ํฐ ๊ธธ์ด๋ 8192๋ก, ์ ๊ณต๋ ๋ชจ๋ธ๋ค ์ค ๊ฐ์ฅ ๊ธด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์์ต๋๋ค. | ๊ฐ์ฅ ๊ธด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ์ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ชจ๋ธ์ ์ต๋ ํ ํฐ ๊ธธ์ด๋ 8192์ด๋ฉฐ, ๋ฒกํฐ ์ฐจ์ ์๋ 1024์ ๋๋ค. | ๊ฐ์ฅ ๊ธด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ์ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ชจ๋ธ์ ์ต๋ ํ ํฐ ๊ธธ์ด๋ 8192์ด๋ฉฐ, ๋ฒกํฐ ์ฐจ์ ์๋ 1024์ ๋๋ค. | ๊ฐ์ฅ ๊ธด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ์ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ ๋๋ค. ์ด ๋ชจ๋ธ์ ์ต๋ ํ ํฐ ๊ธธ์ด๋ 8192์ด๋ฉฐ, ๋ฒกํฐ ์ฐจ์ ์๋ 1024์ ๋๋ค. |
๊ฒฐ๊ณผ ์์ฝ: ์ ๋ต์ด ๋ช ํํ ์ฌ์ค ๊ธฐ๋ฐ ๋ฐ์ดํฐ ํ ์คํธ์์๋ ๋ชจ๋ ๋ชจ๋ธ์ด 100% ์ ํํ ๋ต๋ณ์ ์์ฑํ์ง๋ง, ๋ต๋ณ์ '์์ธํจ'์์ ๊ฐ ๋ชจ๋ธ์ ์คํ์ผ ์ฐจ์ด ๋๋ฌ๋จ.
์ฐ์ํ ๋ชจ๋ธ: Snowflake/snowflake-arctic-embed-l-v2.0 / nlpai-lab/KURE-v1
์ด์ : ๋จ์ํ ์ ๋ต๋ง ์ ์ํ๋ ๊ฒ์ ๋์ด, ์ฌ์ฉ์๊ฐ ๊ถ๊ธํดํ ๋งํ ๊ด๋ จ ์ ๋ณด(์: ๋ฒกํฐ ์ฐจ์ ์, GPU๊ฐ ๋ ํจ์จ์ ์ธ ์ด์ ๋ฑ)๋ฅผ ์ถ๊ฐ๋ก ์ ๊ณตํ์ฌ LLM์ด ๋ ์น์ ํ ๋ต๋ณ์ ๋ง๋ค๋๋ก ์ ๋
๋๋จธ์ง ๋ชจ๋ธ์ ์ง๋ฌธ์ ์์ง์ ๋ํ ํต์ฌ ์ ๋ณด๋ง ์ ํํ๊ฒ ์ ๋ฌ.
#2
#๋ฐ์ดํฐ ์์ค
CORPUS = [
# ๋ฌธ์ 1: ๋ฒ ์ด์ง ์๊ธ์ ์ค๋ช
(์๋ฏธ๋ก ์ ๊ฒ์ ํ๊ฒ)
"์ 9,900์์ ๋ฒ ์ด์ง ์๊ธ์ ๋ ๊ด๊ณ ๊ฐ ํฌํจ๋๋ฉฐ, ๋์์ ํ ๋ช
๋ง ์ ์ํ ์ ์์ต๋๋ค. ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ ๊ฐ๋ฅํฉ๋๋ค.",
# ๋ฌธ์ 2: ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ์ค๋ช
(์ ๋ณด ์ถ์ถ ํ๊ฒ)
"ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ์ 15,900์์ผ๋ก, 4K ์ด๊ณ ํ์ง์ ์ง์ํ๋ฉฐ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์์ต๋๋ค. ๋ํ, ์ฝํ
์ธ ๋ฅผ ๋ค์ด๋ก๋ํ์ฌ ์คํ๋ผ์ธ์์ ์์ฒญํ๋ ๊ธฐ๋ฅ๋ ์ ๊ณตํฉ๋๋ค.",
# ๋ฌธ์ 3: ํ๋ถ ๋ฐ ํด์ง ์ ์ฑ
(๋์์ด/๋ฐ๊ฟ์ฐ๊ธฐ ํ๊ฒ)
"๊ตฌ๋
์๋น์ค์ ์ค๋ ํด์ง๋ ์ธ์ ๋ ์ง ๊ฐ๋ฅํ๋ฉฐ, ์์ฝ๊ธ์ด๋ ๋ณ๋์ ์์๋ฃ๋ ๋ฐ์ํ์ง ์์ต๋๋ค. ๊ฒฐ์ ํ 7์ผ ์ด๋ด ์ฝํ
์ธ ์์ฒญ ๊ธฐ๋ก์ด ์๋ ๊ฒฝ์ฐ์ ํํด ์ ์ก ํ๋ถ์ด ๊ฐ๋ฅํฉ๋๋ค.",
# ๋ฌธ์ 4: ๋ฌด๋ฃ ์ฒดํ ์ด๋ฒคํธ (์ ๋งคํจ ๊ตฌ๋ถ ํ๊ฒ)
"์ ๊ท ๊ฐ์
์๋ ์ฒซ ๋ฌ์ ํํด ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ฅผ ๋ฌด๋ฃ๋ก ์ฒดํํ ์ ์์ต๋๋ค. ๋ฌด๋ฃ ์ฒดํ ๊ธฐ๊ฐ์ด ๋๋๋ฉด ์๋์ผ๋ก ์ ๋ฃ ๊ฒฐ์ ๋ก ์ ํ๋๋ ์ฃผ์๊ฐ ํ์ํฉ๋๋ค."
]
#ํ
์คํธ ์ง๋ฌธ
QUESTIONS = [
# ์ง๋ฌธ 1: '๊ด๊ณ ์์ด'๋ผ๋ ํค์๋๋ ์์ง๋ง, ์๋ฏธ์ ์ผ๋ก ๊ด๋ จ๋ ๋ฌธ์๋ฅผ ์ฐพ์์ผ ํจ
"๊ด๊ณ ์ ๋ณด๊ณ ์ถ์ผ๋ฉด ์ด๋ค ์๊ธ์ ๋ฅผ ์จ์ผ ํ๋์?",
# ์ง๋ฌธ 2: ๊ธด ๋ฌธ๋จ ์์์ '4๊ฐ'๋ผ๋ ํน์ ์ ๋ณด๋ฅผ ์ ํํ ์ฐพ์๋ด์ผ ํจ
"ํ ๊ณ์ ์ ํ๋กํ์ ์ด ๋ช ๊ฐ๊น์ง ๋ง๋ค ์ ์์ด์?",
# ์ง๋ฌธ 3: '๋ฒ๊ธ'๊ณผ '์์ฝ๊ธ'์ด ๊ฐ์ ์๋ฏธ์์ ํ์
ํด์ผ ํจ
"๊ตฌ๋
์ค๊ฐ์ ์ทจ์ํ๋ฉด ๋ฒ๊ธ์ ๋ด์ผ ํ๋์?",
# ์ง๋ฌธ 4: '๋ฌด๋ฃ ์๊ธ์ '์ '๋ฌด๋ฃ ์ฒดํ'์ ์ฐจ์ด๋ฅผ ๊ตฌ๋ถํด์ผ ํจ (๊ฐ์ฅ ์ด๋ ค์ด ์ง๋ฌธ)
"์์ ๋ฌด๋ฃ์ธ ์๊ธ์ ๋ ์๋์?"
]
์์ ์๊ฐ ๊ฒฐ๊ณผ
| ๋ชจ๋ธ ์ด๋ฆ | ๋ฒกํฐ DB ์์ฑ ์๊ฐ (์ด) (๋ฌธ์ ์๋ฒ ๋ฉ ์๋) |
์ง๋ฌธ๋น ํ๊ท ๋ต๋ณ ์์ฑ ์๊ฐ (์ด) (์ฌ์ฉ์ ์ฒด๊ฐ ์๋) | ๋ต๋ณ ํ์ง |
| multilingual-e5-large-instruct | 0.18 | 0.45 | ๋งค์ฐ ์ฐ์ |
| SamilPwC-AXNode-GenAI/PwC-Embedding_expr | 0.21 | 0.39 | ๋งค์ฐ ์ฐ์ |
| dragonkue/snowflake-arctic-embed-l-v2.0-ko | 0.19 | 0.30 | ์ฐ์ |
| nlpai-lab/KURE-v1 | 0.20 | 0.30 | ์ฐ์ |
| Snowflake/snowflake-arctic-embed-l-v2.0 | 0.21 | 0.28 | ์ฐ์ |
# 2 ๋ชจ๋ธ๋ณ ๋ต๋ณ ๋น๊ต
| ์ง๋ฌธ (Question) | Snowflake ์๋ณธ | e5-large-instruct | PwC-expr | dragonkue-ko | KURE-v1 |
| ๊ด๊ณ ์ ๋ณด๊ณ ์ถ์ผ๋ฉด ์ด๋ค ์๊ธ์ ๋ฅผ ์จ์ผ ํ๋์? | ๊ด๊ณ ๋ฅผ ๋ณด์ง ์์ผ๋ ค๋ฉด ์คํ ๋ค๋ ์๊ธ์ ์ด์์ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด, ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํ๋ค๊ณ ๋ช ์๋์ด ์์ต๋๋ค. | ๊ด๊ณ ๋ฅผ ๋ณด์ง ์์ผ๋ ค๋ฉด ์คํ ๋ค๋ ์๊ธ์ ์ด์์ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํฉ๋๋ค. | ๊ด๊ณ ๋ฅผ ๋ณด์ง ์์ผ๋ ค๋ฉด ์คํ ๋ค๋ ์๊ธ์ ์ด์์ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํฉ๋๋ค. | ๊ด๊ณ ๋ฅผ ๋ณด์ง ์์ผ๋ ค๋ฉด ์คํ ๋ค๋ ์๊ธ์ ์ด์์ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํฉ๋๋ค. | ๊ด๊ณ ๋ฅผ ๋ณด์ง ์์ผ๋ ค๋ฉด ์คํ ๋ค๋ ์๊ธ์ ์ด์์ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํฉ๋๋ค. |
| ํ ๊ณ์ ์ ํ๋กํ์ ์ด ๋ช ๊ฐ๊น์ง ๋ง๋ค ์ ์์ด์? | ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ํ ๊ณ์ ์ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์์ต๋๋ค. | ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ์ 15,900์์ผ๋ก, 4K ์ด๊ณ ํ์ง์ ์ง์ํ๋ฉฐ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์์ต๋๋ค. | ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ํ ๊ณ์ ์ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์์ต๋๋ค. | ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ์ 15,900์์ผ๋ก, 4K ์ด๊ณ ํ์ง์ ์ง์ํ๋ฉฐ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์์ต๋๋ค. | ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ์ 15,900์์ผ๋ก, 4K ์ด๊ณ ํ์ง์ ์ง์ํ๋ฉฐ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์์ต๋๋ค. |
| ๊ตฌ๋ ์ค๊ฐ์ ์ทจ์ํ๋ฉด ๋ฒ๊ธ์ ๋ด์ผ ํ๋์? | ๊ตฌ๋ ์๋น์ค์ ์ค๋ ํด์ง๋ ์ธ์ ๋ ์ง ๊ฐ๋ฅํ๋ฉฐ, ์์ฝ๊ธ์ด๋ ๋ณ๋์ ์์๋ฃ๋ ๋ฐ์ํ์ง ์์ต๋๋ค. | ๊ตฌ๋ ์๋น์ค์ ์ค๋ ํด์ง๋ ์ธ์ ๋ ์ง ๊ฐ๋ฅํ๋ฉฐ, ์์ฝ๊ธ์ด๋ ๋ณ๋์ ์์๋ฃ๋ ๋ฐ์ํ์ง ์์ต๋๋ค. | ๊ตฌ๋ ์๋น์ค์ ์ค๋ ํด์ง๋ ์ธ์ ๋ ์ง ๊ฐ๋ฅํ๋ฉฐ, ์์ฝ๊ธ์ด๋ ๋ณ๋์ ์์๋ฃ๋ ๋ฐ์ํ์ง ์์ต๋๋ค. | ๊ตฌ๋ ์๋น์ค์ ์ค๋ ํด์ง๋ ์ธ์ ๋ ์ง ๊ฐ๋ฅํ๋ฉฐ, ์์ฝ๊ธ์ด๋ ๋ณ๋์ ์์๋ฃ๋ ๋ฐ์ํ์ง ์์ต๋๋ค. | ๊ตฌ๋ ์๋น์ค์ ์ค๋ ํด์ง๋ ์ธ์ ๋ ์ง ๊ฐ๋ฅํ๋ฉฐ, ์์ฝ๊ธ์ด๋ ๋ณ๋์ ์์๋ฃ๋ ๋ฐ์ํ์ง ์์ต๋๋ค. |
| ์์ ๋ฌด๋ฃ์ธ ์๊ธ์ ๋ ์๋์? | ์ ๊ท ๊ฐ์ ์๋ ์ฒซ ๋ฌ์ ํํด ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ฅผ ๋ฌด๋ฃ๋ก ์ฒดํํ ์ ์์ต๋๋ค. ๋ฌด๋ฃ ์ฒดํ ๊ธฐ๊ฐ์ด ๋๋๋ฉด ์๋์ผ๋ก ์ ๋ฃ ๊ฒฐ์ ๋ก ์ ํ๋๋ ์ฃผ์๊ฐ ํ์ํฉ๋๋ค. | ๋ค, ์์ ๋ฌด๋ฃ์ธ ์๊ธ์ ๋ ์์ต๋๋ค. ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด, ๋ฒ ์ด์ง ์๊ธ์ ๋ ์ 9,900์์ผ๋ก ๊ด๊ณ ๊ฐ ํฌํจ๋๋ฉฐ ํ ๋ช ๋ง ์ ์ํ ์ ์์ต๋๋ค. ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ์ 15,900์์ผ๋ก, 4K ์ด๊ณ ํ์ง์ ์ง์ํ๋ฉฐ ์ต๋ 4๊ฐ์ ํ๋กํ์ ์์ฑํ ์ ์๊ณ , ์ฝํ ์ธ ๋ฅผ ๋ค์ด๋ก๋ํ์ฌ ์คํ๋ผ์ธ์์ ์์ฒญํ ์ ์๋ ๊ธฐ๋ฅ๋ ์ ๊ณตํฉ๋๋ค. ์ ๊ท ๊ฐ์ ์๋ ์ฒซ ๋ฌ์ ํํด ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ฅผ ๋ฌด๋ฃ๋ก ์ฒดํํ ์ ์์ง๋ง, ๋ฌด๋ฃ ์ฒดํ ๊ธฐ๊ฐ์ด ๋๋๋ฉด ์๋์ผ๋ก ์ ๋ฃ ๊ฒฐ์ ๋ก ์ ํ๋ฉ๋๋ค. | ๋ค, ์์ ๋ฌด๋ฃ์ธ ์๊ธ์ ๋ ์์ต๋๋ค. ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด, ๋ฒ ์ด์ง ์๊ธ์ ๋ ์ 9,900์์ผ๋ก ๊ด๊ณ ๊ฐ ํฌํจ๋๋ฉฐ, ์คํ ๋ค๋ ์๊ธ์ ๋ถํฐ๋ ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ ์ 15,900์์ผ๋ก ๊ด๊ณ ์์ด ์์ฒญ์ด ๊ฐ๋ฅํ๋ฉฐ, 4K ์ด๊ณ ํ์ง๊ณผ ์ต๋ 4๊ฐ์ ํ๋กํ ์์ฑ, ์คํ๋ผ์ธ ์์ฒญ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. ์ ๊ท ๊ฐ์ ์๋ ์ฒซ ๋ฌ์ ํํด ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ฅผ ๋ฌด๋ฃ๋ก ์ฒดํํ ์ ์์ง๋ง, ๋ฌด๋ฃ ์ฒดํ ๊ธฐ๊ฐ์ด ๋๋๋ฉด ์๋์ผ๋ก ์ ๋ฃ ๊ฒฐ์ ๋ก ์ ํ๋ฉ๋๋ค. | ์ ๊ท ๊ฐ์ ์๋ ์ฒซ ๋ฌ์ ํํด ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ฅผ ๋ฌด๋ฃ๋ก ์ฒดํํ ์ ์์ต๋๋ค. ๋ฌด๋ฃ ์ฒดํ ๊ธฐ๊ฐ์ด ๋๋๋ฉด ์๋์ผ๋ก ์ ๋ฃ ๊ฒฐ์ ๋ก ์ ํ๋๋ ์ฃผ์๊ฐ ํ์ํฉ๋๋ค. | ์ ๊ท ๊ฐ์ ์๋ ์ฒซ ๋ฌ์ ํํด ํ๋ฆฌ๋ฏธ์ ์๊ธ์ ๋ฅผ ๋ฌด๋ฃ๋ก ์ฒดํํ ์ ์์ต๋๋ค. ๋ฌด๋ฃ ์ฒดํ ๊ธฐ๊ฐ์ด ๋๋๋ฉด ์๋์ผ๋ก ์ ๋ฃ ๊ฒฐ์ ๋ก ์ ํ๋๋ ์ฃผ์๊ฐ ํ์ํฉ๋๋ค. |
๊ฒฐ๊ณผ ์์ฝ: ๋ฏธ๋ฌํ๊ณ ๊น๋ค๋ก์ด ์ง๋ฌธ์ด ํฌํจ๋ ์ด ํ ์คํธ์์๋ ๋ชจ๋ธ ๊ฐ์ '์๋ฏธ ์ดํด ๋ฅ๋ ฅ'์์ ๊ฒฐ์ ์ ์ธ ์ฐจ์ด๊ฐ ๋๋ฌ๋ฌ์.
๊ฐ์ฅ ์ฑ๋ฅ ์ฐ์ํ ๋ชจ๋ธ : intfloat/multilingual-e5-large-instruct / SamilPwC-AXNode-GenAI/PwC-Embedding_expr
์ด์ : ๊ฐ์ฅ ์ด๋ ค์ด ์ง๋ฌธ("์์ ๋ฌด๋ฃ์ธ ์๊ธ์ ๋ ์๋์?")์ ๋ํด, "์๋ค"๊ณ ๋ช ํํ ๋ต๋ณํ ํ ๋์์ ์ ์.
์ฌ์ฉ์์ ์ง๋ฌธ ์๋๋ฅผ ๊ฐ์ฅ ์ ํํ๊ฒ ํ์ ํ์์ ์๋ฏธ
์ต์ข ๊ฒฐ๋ก


๊พธ์คํ ๋ต๋ณ ํ์ง์ด ์ฐ์ํ๊ณ
์๋ฒ ๋ฉํ๋ ์๋๊ฐ ๊ฐ์ฅ ๋น ๋ฅธ
intfloat/multilingual-e5-large-instruct ๋ก ๊ฒฐ์
๋ชจ๋ ์ปค๋ฎค๋ํฐ์์ ๊พธ์คํ ์ธ๊ธ๋๋ ์ด์ ๊ฐ ์๋ค. ใ ใ ๊ตฟ
์ฐธ๊ณ
์๋ฒ ๋ฉ์ด๋ ๋ฌด์์ธ๊ฐ์? | IBM
์๋ฒ ๋ฉ์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์๋ฏธ๋ก ์ ์ธ ์๋ฏธ๊ฐ ์๋ ์ฐ์ ๋ฒกํฐ ๊ณต๊ฐ์์ ํ ์คํธ ๋ฐ ๊ธฐํ ๊ฐ์ฒด๋ฅผ ์ ์ผ๋ก ๋ํ๋ด๋ ์๋จ์ ๋๋ค.
www.ibm.com
์๋ฒ ๋ฉ ๊น์ด ํํค์น๊ธฐ: RAG์ ํต์ฌ ๊ธฐ์
ํ๋์ ํ ์คํธ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์์ Embedding ๊ธฐ์ ์ ๋งค์ฐ ์ค์ํ ์ญํ ์ ํ๊ณ ์์ต๋๋ค. ์๋ฒ ๋ฉ ๊ธฐ์ ์ ์๋ฏธ ๊ธฐ๋ฐ ๊ฒ์(Semantic Search), ์ถ์ฒ(Recommendation), ๊ตฐ์งํ(Clustering) ๋ฑ ๋ค์ํ ์ ํ๋ฆฌ์ผ์ด์ ์์
medium.com
LLM ์๋ฒ ๋ฉ ๋ชจ๋ธ
LLM ์๋ฒ ๋ฉ ๋ชจ๋ธ ์๋งจํฑ ์ธํ ๋ฆฌ์ ์ค์ ์๋ก์ด ์๋ ํค์๋๋ฅผ ๋์ด ๊ฐ๋ ์ผ๋ก AI ๊ธฐ์ ์ ๋ฐ์ ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ณ ์ดํดํ๋ ๋ฐฉ์์ ๊ทผ๋ณธ์ ์ธ ๋ณํ๋ฅผ ๊ฐ์ ธ์๋ค. ์ด ๋ณํ์ ์ค์ฌ์๋ ๋๊ท๋ชจ
velog.io
'LLM' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| Vector Database ๋ฒกํฐ DB (0) | 2025.10.03 |
|---|
