RAG ๊ตฌ์ถ•์„ ์œ„ํ•œ ํ•œ๊ตญ์–ด ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์„ ์ •ํ•˜๊ธฐ

2025. 10. 2. 20:33ยทLLM

 

1. ์ž„๋ฒ ๋”ฉ (Embedding) ์ด๋ž€ 

  • ๋‹จ์–ด, ๋ฌธ์žฅ, ์ด๋ฏธ์ง€ ๋“ฑ ์‚ฌ๋žŒ์ด ์‚ฌ์šฉํ•˜๋Š” ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๊ณ„๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ์ˆซ์ž ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ • ๋˜๋Š” ๊ทธ ๊ฒฐ๊ณผ๋ฌผ
  • ๋ฐ์ดํ„ฐ๋ฅผ ์ž„๋ฒ ๋”ฉ ์ƒ์„ฑ ๋ชจ๋ธ์— ์ž…๋ ฅํ•˜๋ฉด ์ผ์ • ์ˆ˜์˜ ์‹ค์ˆ˜๋กœ ๊ตฌ์„ฑ๋œ ๋ฒกํ„ฐ ์ถœ๋ ฅ๋จ. 
  • ์‚ฌ๋žŒ์ด ์ง์ ‘ ๊ด€์ฐฐ, ์˜๋ฏธ ํŒŒ์•…ํ•˜๊ธฐ๋Š” ์–ด๋ ต์ง€๋งŒ ์ปดํ“จํ„ฐ๋Š” “์ž„๋ฒ ๋”ฉ” ๊ฐ„์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ„์‚ฐํ•˜์—ฌ “์˜๋ฏธ์ ์ธ ๊ด€๊ณ„” ์ดํ•ด ๊ฐ€๋Šฅ. 
  • ์‚ฌ์‹ค์ƒ ๋ชจ๋“  ์œ ํ˜•์˜ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์‹œ๋ฉ˜ํ‹ฑ ์ •๋ณด๋ฅผ ์ธ์ฝ”๋”ฉํ•ด์„œ ๊ณ ์ฐจ์› ๋ฒกํ„ฐ๋กœ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ. 

 

2. ์ž„๋ฒ ๋”ฉ์˜ ์—ญํ•  

  • ๋‹จ์–ด, ๋ฌธ์žฅ ๊ฐ„ ์˜๋ฏธ ๊ด€๋ จ๋„ ๊ณ„์‚ฐ
  • ์„œ๋กœ ๋‹ค๋ฅธ ๋‹จ์–ด์™€ ๋ฒ”์ฃผ ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ์ดํ•ด
  • ์˜๋ฏธ์ , ๋ฌธ๋ฒ•์  ์ •๋ณด ํ•จ์ถ• → ๋ฒกํ„ฐ๊ฐ’์ด๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์น™์—ฐ์‚ฐ์œผ๋กœ ๋‹จ์–ด๋“ค ์‚ฌ์ด์˜ ์˜๋ฏธ, ๋ฌธ๋ฒ•์  ๊ด€๊ณ„ ๋„์ถœ ๊ฐ€๋Šฅ.

 

3. ์ž„๋ฒ ๋”ฉ ์ž‘๋™ ๋ฐฉ์‹ 

  • ๋Œ€๋ถ€๋ถ„์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ž…๋ ฅ ๊ฐ’ : ์ €์ฐจ์›์˜ ์ˆซ์ž ๋ฐ์ดํ„ฐ 
  • ๋”ฐ๋ผ์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆซ์ž๋กœ ํ‘œํ˜„ํ•ด์•ผ ํ•œ๋‹ค. 
  • ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์— ๊ฐ์ฒด ์ž…๋ ฅ  → ๋ฒกํ„ฐ(์ˆซ์ž์˜ ๋ฐฐ์—ด)๋กœ ํ‘œํ˜„๋˜๋Š” ์ž„๋ฒ ๋”ฉ์œผ๋กœ ์ถœ๋ ฅ๋จ. 
  • ๊ฐ ์ˆซ์ž๋Š” ์ฐจ์›์„ ๋”ฐ๋ผ ๊ฐ์ฒด๊ฐ€ ์žˆ๋Š” ์œ„์น˜๋ฅผ ๋‚˜ํƒ€๋ƒ„ 
  • ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ๋ณต์žก์„ฑโฌ†, ์ฐจ์›์˜ ์ˆ˜ โฌ† (์ˆ˜๋ฐฑ ์ˆ˜์ฒœ๊ฐœ ์ด์ƒ ๊ฐ€๋Šฅ) 
  • ์ž„๋ฒ ๋”ฉ ๊ฐ’๋“ค์€ ํ•ด๋‹น n์ฐจ์› ๊ณต๊ฐ„์—์„œ ์„œ๋กœ ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ์˜๋ฏธ์ ์œผ๋กœ ์œ ์‚ฌํ•จ 
  • ์œ ์‚ฌ์„ฑ ํŒ๋‹จ : ๋ฒกํ„ฐ ์ ์˜ ๊ธธ์ด๋กœ ํŒ๋‹จ (์œ ํด๋ฆฌ๋“œ, ์ฝ”์‚ฌ์ธ ๋“ฑ์œผ๋กœ ์ธก์ •) 
  • ์ฐจ์› ์ถ•์†Œ: ๊ณ ์ฐจ์›๋ฐ์ดํ„ฐ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ์ž„๋ฒ ๋”ฉํ•˜๊ธฐ ์œ„ํ•ด ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์—์„œ ๊ด€๋ จ ์—†๊ฑฐ๋‚˜ ์ค‘๋ณต๋˜๋Š” ์ •๋ณด๋Š” ์ €์ฐจ์› ๊ณต๊ฐ„์œผ๋กœ ์••์ถ•ํ•จ. ์ž์ฃผ ์“ฐ์ž„. (ex. ์˜คํ†  ์ธ์ฝ”๋”, ์ปจ๋ณผ๋ฃจ์…˜, ์ฃผ์„ฑ๋ถ„ ๋ถ„์„ ๋ฐ T-๋ถ„์‚ฐ ํ™•๋ฅ ์  ์ด์›ƒ ์ž„๋ฒ ๋”ฉ ๋“ฑ ) 

์˜ˆ์‹œ

 “dad"=[0.1548,0.4848,…,1.864] 

 “mom"=[0.8785,0.8974,…,2.794] 

 

 

4. ์ž„๋ฒ ๋”ฉ ํ™œ์šฉ 

- ํด๋Ÿฌ์Šคํ„ฐ๋ง 

- ๋น„๊ต

- ๋ถ„๋ฅ˜ ๋“ฑ์˜ ์ž‘์—… ํšจ๊ณผ์ ์œผ๋กœ ์ˆ˜ํ–‰ ๊ฐ€๋Šฅ 

 

์‚ฌ์šฉ ์‚ฌ๋ก€ ์˜ˆ์‹œ ์ƒํ™ฉ : ์ถ”์ฒœ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๊ตฌํ˜„ ๋ฐฉ๋ฒ• 

  • ๋ชจ๋“  ์‚ฌ์šฉ์ž์˜ ํ•ญ๋ชฉ (์˜ํ™”, ์ œํ’ˆ ๋“ฑ) ์„ ์—ฐ์† ๋ฒกํ„ฐ ๊ณต๊ฐ„, ์ฆ‰ ์ž ์žฌ ๊ณต๊ฐ„์—์„œ ๊ณ ์ฐจ์› ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•œ ๋’ค ์ž„๋ฒ ๋”ฉ์˜ ์ ๊ณฑ์„ ํ•ด๋‹น ํ•ญ๋ชฉ์— ๋Œ€ํ•œ "์‚ฌ์šฉ์ž์˜ ์„ ํ˜ธ๋„"์™€ ์—ฐ๊ด€๋˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๊ฐ ์‚ฌ์šฉ์ž ๋ฐ ํ•ญ๋ชฉ์— ๋Œ€ํ•œ ํ‘œํ˜„์„ ํ•™์Šตํ•จ. 
  • ์ถ”์ฒœ ์‹œ์—๋Š” ํ•ด๋‹น ์‚ฌ์šฉ์ž์˜ ๋ฒกํ„ฐ์™€ ์•„์ง ์ƒํ˜ธ์ž‘์šฉํ•˜์ง€ ์•Š์€ ์•„์ดํ…œ๋“ค์˜ ๋ฒกํ„ฐ๋ฅผ ๊ฐ๊ฐ ๋‚ด์ ํ•˜์—ฌ, ๊ณ„์‚ฐ๋œ ์„ ํ˜ธ๋„ ์˜ˆ์ธก ์ ์ˆ˜๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ์•„์ดํ…œ๋“ค์„ ์ œ์‹œํ•จ. 

*์ ๊ณฑ: ๋‚ด์ , ๋‘ ๋ฒกํ„ฐ์—์„œ ํ•˜๋‚˜์˜ ์Šค์นผ๋ผ๊ฐ’์„ ์–ป๋Š” ์—ฐ์‚ฐ 

 

 

5. ์ž„๋ฒ ๋”ฉ์„ ์‚ฌ์šฉํ•˜๋Š” ์ด์œ  

๊ณ ์ฐจ์› ๋ฐ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ์—ฐ์† ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜๊ณ  ์˜๋ฏธ ์žˆ๋Š” ํŒจํ„ด, ๊ด€๊ณ„, ์˜๋ฏธ๋ก  ํฌ์ฐฉ ๊ฐ€๋Šฅํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ๋ฐ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์ถ”์„ธ.

 

1) ์˜๋ฏธ๋ก ์  ํ‘œํ˜„: ์˜๋ฏธ ๊ด€๊ณ„ ๋ฐ ์œ ์‚ฌ์„ฑ ํฌ์ฐฉ์œผ๋กœ ๋ชจ๋ธ์ด ๋” ์ž˜ ์ดํ•ดํ•˜๊ณ  ์ผ๋ฐ˜ํ™”ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋„์™€์คŒ 

2) ์ฐจ์› ์ถ•์†Œ: : ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ (์ด๋ฏธ์ง€, ํ…์ŠคํŠธ, ๊ทธ๋ž˜ํ”„ ๋“ฑ) ๋ฅผ ์ €์ฐจ์› ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜ ๊ฐ€๋Šฅ 

3) ๋ชจ๋ธ ์ผ๋ฐ˜ํ™”: ์˜๋ฏธ ์žˆ๋Š” ํ‘œํ˜„ ํ•™์Šต ๋•๋ถ„์— ์ƒˆ๋กœ์šด ์˜ˆ์‹œ๋„ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ. 

4) ์‹ ๊ฒฝ๋ง์˜ ํšจ์œจ์ ์ธ ํ•™์Šต: ์ผ๋ฐ˜์ ์œผ๋กœ ์‹ ๊ฒฝ๋ง ์•„ํ‚คํ…์ณ์—์„œ ๋ฒ”์ฃผํ˜• ์ž…๋ ฅ์„ ์—ฐ์† ๋ฒกํ„ฐ์— ๋งคํ•‘ํ•ด ์—ญ์ „ํŒŒ ๋ฐ ์ตœ์ ํ™” ์ด‰์ง„ 

 

 

์ž„๋ฒ ๋”ฉ ์ตœ์‹  ๊ธฐ์ˆ  ๋™ํ–ฅ ์ฐธ๊ณ  (2025๋…„ 9์›” ๊ธฐ์ค€) 

์ฃผ์š” ํ‚ค์›Œ๋“œ : ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ž„๋ฒ ๋”ฉ, ์žฅ๋ฌธ ์ปจํ…์ŠคํŠธ ํ˜๋ช… 

 

LLM ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ

LLM ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์‹œ๋งจํ‹ฑ ์ธํ…”๋ฆฌ์ „์Šค์˜ ์ƒˆ๋กœ์šด ์‹œ๋Œ€ ํ‚ค์›Œ๋“œ๋ฅผ ๋„˜์–ด ๊ฐœ๋…์œผ๋กœ AI ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์€ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ณ  ์ดํ•ดํ•˜๋Š” ๋ฐฉ์‹์— ๊ทผ๋ณธ์ ์ธ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์™”๋‹ค. ์ด ๋ณ€ํ™”์˜ ์ค‘์‹ฌ์—๋Š” ๋Œ€๊ทœ๋ชจ

velog.io

 

 

6. ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์ข…๋ฅ˜ 

  • Google, OpenAI, Cohere์™€ ๊ฐ™์€ ๊ฑฐ๋Œ€ ๊ธฐ์—…๋“ค์ด ์ œ๊ณตํ•˜๋Š” ๋Œ€๊ทœ๋ชจ API ๊ธฐ๋ฐ˜์˜ ๋…์  ๋ชจ๋ธ → ์œ ๋ฃŒ
  • Qwen, NVIDIA, Nomic, BAAI ๋“ฑ์ด ์ฃผ๋„ํ•˜๋Š” ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ → ๋ฌด๋ฃŒ

์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์ข…๋ฅ˜๋ฅผ ์•Œ์•„๋ณด์ž. 

์šฐ์„  ์ข…๋ฅ˜๋ฅผ ์•Œ์•„๋ณด๋ ค๊ณ  ๊ฒ€์ƒ‰ํ•ด๋ณด๋‹ˆ ๊ตฌ์กฐ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜(์ธ์ฝ”๋”/๋””์ฝ”๋”), ๋ผ์ด์„ ์Šค ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜, ๊ฐ์ฒด ํƒ€์ž… ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜(๋‹จ์–ด/๋ฌธ๋งฅ/๋ฌธ์žฅ/์˜ค๋””์˜ค/์ด๋ฏธ์ง€ ๋“ฑ) ๋ถ„๋ฅ˜ ๋“ฑ๋“ฑ ๋ถ„๋ฅ˜ ๊ธฐ์ค€์ด ๋งค์šฐ ๋‹ค์–‘ํ–ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” RAG ๊ธฐ๋ฐ˜ LLM ๊ตฌ์ถ•์ด ๋ชฉํ‘œ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋ชจ๋“  ๋ถ„๋ฅ˜๊ธฐ์ค€์— ์–ฝ๋งค์ผ ํ•„์š”๋Š” ์—†๋‹ค. 

๋˜ํ•œ ํ”„๋กœ์ ํŠธ ํŠน์„ฑ์ƒ ์ œ์•ฝ ์‚ฌํ•ญ๋“ค์ด ๋ช‡๊ฐ€์ง€ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ํ•จ๊ป˜ ๊ณ ๋ คํ•˜์—ฌ ๋ชจ๋ธ์„ ์„ ์ •ํ•  ๊ฒƒ์ด๋‹ค. 

 

๋‹จ์–ด ์ž„๋ฒ ๋”ฉ VS ๋ฌธ์žฅ ๋˜๋Š” ๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ 

๋‹จ์–ด ์ž„๋ฒ ๋”ฉ(word embedding): ๋‹จ์–ด๋“ค์˜ ์˜๋ฏธ, ๋ฌธ๋ฒ•์  ์†์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๋‹ค๋ฅธ ๋‹จ์–ด๋“ค๊ณผ์˜ ๊ด€๊ณ„๋ฅผ ๋ฐ€์ง‘๋œ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ• . 

๊ฐ ๋‹จ์–ด์— ๋Œ€ํ•ด ๊ณ ์ •๋œ ๋ฒกํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. 

์ฃผ์š” ๋ชฉํ‘œ๋Š” ์˜๋ฏธ ์ฒด๊ณ„ ๊ด€๊ณ„์™€ ๋ฌธ๋งฅ ์ •๋ณด๋ฅผ ์บก์ฒ˜ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋‹จ์–ด๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์ž„. ๋‹จ์–ด ๊ฐ๊ฐ์˜ ์˜๋ฏธ๋Š” ์•Œ์ง€๋งŒ, ๋ฌธ์žฅ ์ „์ฒด์˜ ๋ฌธ๋งฅ์  ์˜๋ฏธ๋ฅผ ํ•˜๋‚˜์˜ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜์ง€ ๋ชปํ•จ. 

ex) Word2Vec, GloVe, FastText

 

๋ฌธ์žฅ/๋ฌธ๋งฅ ์ž„๋ฒ ๋”ฉ(contextual word embedding) : ๋ฌธ์žฅ ๋‚ด์—์„œ ๋‹จ์–ด์˜ ์˜๋ฏธ๋ฅผ ๊ทธ ์ฃผ๋ณ€ ๋งฅ๋ฝ์„ ํ†ตํ•ด ์บก์ฒ˜ํ•˜๋Š” ๋ฐฉ์‹. ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ๊ณผ ๋‹ค๋ฅด๊ฒŒ ๋ฌธ๋งฅ์— ๋”ฐ๋ผ ๊ฐ ๋‹จ์–ด์— ๋Œ€ํ•œ ๋‹ค๋ฅธ ๋ฒกํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. ๋ฌธ์žฅ์ด๋‚˜ ๋ฌธ๋‹จ ์ „์ฒด์˜ ์˜๋ฏธ๋ฅผ ํ•˜๋‚˜์˜ ๋ฒกํ„ฐ๋กœ ์••์ถ•ํ•จ. ๋” ์ •ํ™•ํ•œ ์˜๋ฏธ ๋ฐ˜์˜์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 

ex) BERT ๊ณ„์—ด 

 

์ธ์ฝ”๋” ๊ธฐ๋ฐ˜ VS ๋””์ฝ”๋” ๊ธฐ๋ฐ˜ 

ํ˜„๋Œ€์˜ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ๋“ค์€ ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ ๊ตฌ์กฐ (encoder-decoder) ์— ๊ธฐ๋ฐ˜ํ•˜์˜€๋‹ค. 

= ์ธ์ฝ”๋”๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ›์•„๋“ค์—ฌ ์ค‘์š” ์ •๋ณด๋ฅผ ์••์ถ•ํ•œ ๊ณ ์ฐจ์› ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋ฉฐ, ๋””์ฝ”๋”์—์„œ๋Š” ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ตœ์ข… ์ถœ๋ ฅ ์ƒ์„ฑ. 

ex) ์ธ์ฝ”๋” ๊ธฐ๋ฐ˜ ๋ชจ๋ธ BERT, ๋””์ฝ”๋” ๊ธฐ๋ฐ˜ ๋ชจ๋ธ GPT

 

์ธ์ฝ”๋”๊ธฐ๋ฐ˜ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ: ๋ฌธ์žฅ ์ „์ฒด์˜ ๋ฌธ๋งฅ์„ "์–‘๋ฐฉํ–ฅ" ์œผ๋กœ ์ฝ๊ณ , ๊ทธ ์˜๋ฏธ๋ฅผ ํ•˜๋‚˜ํ•˜๋‚˜ ๋ฒกํ„ฐ๋กœ ์••์ถ•(์š”์•ฝ) ํ•˜๋Š” ๊ฒƒ์— ์ตœ์ ํ™” ๋จ. 

์ฃผ์š”ํ™œ๋™: ์ž„๋ฒ ๋”ฉ ์ƒ์„ฑ, ํ…์ŠคํŠธ ๋ถ„๋ฅ˜, ์งˆ๋ฌธ-์‘๋‹ต, ๊ฐ์ • ๋ถ„์„ ๋“ฑ.

ex) BERT ๋“ฑ 

 

๋””์ฝ”๋” ๊ธฐ๋ฐ˜ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ: ๊ธฐ๋ณธ์ ์ธ ์—ญํ• ์€ ๋‹ค์Œ์— ์˜ฌ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜์—ฌ ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ. ๋‹ค์Œ ๋‹จ์–ด๋ฅผ ์ž˜ ์˜ˆ์ธกํ•œ๋‹ค๋Š” ๊ฒƒ์€ ์•ž์„  ํ…์ŠคํŠธ์˜ ๋ฌธ๋งฅ์„ ์ž˜ ์ดํ•ดํ•œ๋‹ค๋Š” ๋œป์ด๋ฉฐ ์ด์— ์˜๋ฏธ ๋ฒกํ„ฐ๋ฅผ ๋ฝ‘์•„๋‚ด๋Š” ์—ญํ• ๋„ ํ•จ. 

ex) GPT, OpenAI์˜ text-embedding-ada-002 ๋“ฑ. 

 

๋ฐ์ดํ„ฐ ์ข…๋ฅ˜์— ๋”ฐ๋ฅธ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ๋ถ„๋ฅ˜ 

1. ํ…์ŠคํŠธ ์ž„๋ฒ ๋”ฉ (Text Embedding)

  • ์ง€๊ธˆ๊นŒ์ง€ ์šฐ๋ฆฌ๊ฐ€ ์ด์•ผ๊ธฐํ–ˆ๋˜ ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค. ๋‹จ์–ด, ๋ฌธ์žฅ, ๋ฌธ์„œ ๊ฐ™์€ ์ž์—ฐ์–ด๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชฉํ‘œ: ์˜๋ฏธ์ , ๋ฌธ๋งฅ์  ์œ ์‚ฌ์„ฑ์„ ๋ฒกํ„ฐ ๊ณต๊ฐ„์˜ ๊ฑฐ๋ฆฌ๋กœ ํ‘œํ˜„ํ•ฉ๋‹ˆ๋‹ค.
  • ์ฃผ์š” ๋ชจ๋ธ: Word2Vec, GloVe, BERT, RoBERTa, GPT ๋“ฑ

2. ์ด๋ฏธ์ง€ ์ž„๋ฒ ๋”ฉ (Image Embedding)

  • ์ด๋ฏธ์ง€๋‚˜ ์‚ฌ์ง„์„ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชฉํ‘œ: ์ด๋ฏธ์ง€์˜ ์‹œ๊ฐ์  ํŠน์ง•(๊ฐ์ฒด, ์ƒ‰์ƒ, ์Šคํƒ€์ผ ๋“ฑ)์„ ํฌ์ฐฉํ•˜์—ฌ, ๋น„์Šทํ•œ ์ด๋ฏธ์ง€๋Š” ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ ๊ฐ€๊น๊ฒŒ ์œ„์น˜์‹œํ‚ต๋‹ˆ๋‹ค.
  • ํ™œ์šฉ: '์ด๋ฏธ์ง€๋กœ ์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰', ๋น„์Šทํ•œ ์ƒํ’ˆ ์ถ”์ฒœ, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋“ฑ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
  • ์ฃผ์š” ๋ชจ๋ธ: ResNet, VGG, Vision Transformer (ViT) ๋“ฑ

3. ์˜ค๋””์˜ค ์ž„๋ฒ ๋”ฉ (Audio Embedding)

  • ์Œ์•…, ์Œ์„ฑ ๊ฐ™์€ ์†Œ๋ฆฌ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชฉํ‘œ: ์†Œ๋ฆฌ์˜ ํŠน์ง•(์Œ์ƒ‰, ๋ฆฌ๋“ฌ, ๋ฉœ๋กœ๋””, ํ™”์ž์˜ ๋ชฉ์†Œ๋ฆฌ ํ†ค ๋“ฑ)์„ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•ฉ๋‹ˆ๋‹ค.
  • ํ™œ์šฉ: ๋น„์Šทํ•œ ๋ถ„์œ„๊ธฐ์˜ ์Œ์•… ์ถ”์ฒœ, ์Œ์„ฑ ์ธ์‹, ํ™”์ž ์‹๋ณ„ ๋“ฑ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
  • ์ฃผ์š” ๋ชจ๋ธ: VGGish, SoundNet, Wav2Vec ๋“ฑ

4. ๊ทธ๋ž˜ํ”„ ์ž„๋ฒ ๋”ฉ (Graph Embedding)

  • ์†Œ์…œ ๋„คํŠธ์›Œํฌ, ๋ถ„์ž ๊ตฌ์กฐ์ฒ˜๋Ÿผ ๋…ธ๋“œ(์ )์™€ ์—ฃ์ง€(์„ )๋กœ ์—ฐ๊ฒฐ๋œ ๊ด€๊ณ„ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชฉํ‘œ: ๋„คํŠธ์›Œํฌ ๋‚ด์—์„œ ๊ฐ ๋…ธ๋“œ์˜ ๊ด€๊ณ„์ , ๊ตฌ์กฐ์  ์—ญํ• ์„ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•ฉ๋‹ˆ๋‹ค.
  • ํ™œ์šฉ: ์†Œ์…œ ๋ฏธ๋””์–ด ์นœ๊ตฌ ์ถ”์ฒœ, ๋‹จ๋ฐฑ์งˆ ์ƒํ˜ธ์ž‘์šฉ ์˜ˆ์ธก, ์‹ ์•ฝ ๊ฐœ๋ฐœ ๋“ฑ์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
  • ์ฃผ์š” ๋ชจ๋ธ: Node2Vec, DeepWalk ๋“ฑ

 

7. ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์„ ์ • ์‹œ ๊ณ ๋ ค ํ•ด์•ผ ํ•˜๋Š” ๋ถ€๋ถ„ ๋ฐ ํ›„๋ณด ๋ชจ๋ธ ๋ชฉ๋ก 

๋จผ์ € ์šฐ๋ฆฌํŒ€์˜ ์š”๊ตฌ์‚ฌํ•ญ ๋ชฉ๋ก์ด๋‹ค. 

์•„๋ž˜ 3๊ฐ€์ง€๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ ์ถฉ์กฑ๋˜์–ด์•ผ ํ•˜๋Š” ์กฐ๊ฑด๋“ค์ด๋‹ค. ์šฐ๋ฆฌ์˜ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์‚ฌ์šฉ ๋ชฉ์ ์€ RAG ๊ธฐ๋ฐ˜ LLM ๊ตฌ์ถ•์— ์žˆ๊ธฐ ๋•Œ๋ฌธ์— RAG ์„ ๋งŒ๋“ค ๋•Œ์— ์ตœ๊ณ ์˜ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ์ฐพ๊ณ ์ž ํ–ˆ๋‹ค. 

์ดํ›„ ์•„๋ž˜ ๋„ค๊ฐœ๋Š” (4๊ฐ€์ง€) ์‚ฌ์šฉ๊ฐ€๋Šฅ ํ•œ ๋ชจ๋ธ์„ ๋‘๊ณ  ํ•˜๋‚˜์”ฉ ๋น„๊ตํ•ด๋ณผ ์˜ˆ์ •์ด๋‹ค. 

 

1. ๋ฌด๋ฃŒ 

2. ์ƒ์—… ์ œํ•œ ์—†๋Š” ๋ผ์ด์„ ์Šค 

3. ํ•œ๊ตญ์–ด ์„ฑ๋Šฅ ์šฐ์ˆ˜ 

4. RAG ์— ์ ํ•ฉ →  RAG์˜ ํ•ต์‹ฌ์€ '๊ฒ€์ƒ‰(Retrieval)' ์„ฑ๋Šฅ 

 

5. ๋ชจ๋ธ ํฌ๊ธฐ 

6. ๋ฒกํ„ฐ ์ฐจ์›์ˆ˜ →   ๋ฒกํ„ฐDB ์™€ ๊ทœ๊ฒฉ ๋งž์•„์•ผ ํ•จ. 

7. ์—ฐ์‚ฐ์†๋„ → ๋Œ€๋ถ€๋ถ„ ๋งค์šฐ ๋น ๋ฆ„ . . 

8. ์ž์› 

 

 

๋จผ์ € ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ํ•œ๋ˆˆ์— ๋น„๊ตํ•ด๋ณผ์ˆ˜ ์žˆ๋Š” ๋ฒค์น˜๋งˆํฌ ์ด๋‹ค.

 

MTEB Leaderboard - a Hugging Face Space by mteb

 

huggingface.co

 

MTEB(Massive Text Embedding Benchmark) ๋ž€? 

  • ํ…์ŠคํŠธ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋‹ค์–‘ํ•œ ๊ด€์ ์—์„œ ์ข…ํ•ฉ์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๊ณ  ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•ด ๋งŒ๋“ค์–ด์ง„ ํ‘œ์ค€ํ™”๋œ ํ”„๋ ˆ์ž„์›Œํฌ. 
  • ๋ฌธ์žฅ๊ณผ ๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋Š” ๋ฆฌ๋”๋ณด๋“œ๊ฐ€ ์กด์žฌํ•œ๋‹ค. 
  • ๊ฒ€์ƒ‰, ํด๋Ÿฌ์Šคํ„ฐ๋ง, ๋ถ„๋ฅ˜, ์˜๋ฏธ์  ์œ ์‚ฌ๋„ ๋“ฑ ์—ฌ๋Ÿฌ ํƒœ์Šคํฌ๋กœ ๋‚˜๋ˆ  ๋ชจ๋ธ์˜ ์ž„๋ฒ ๋”ฉ ์„ฑ๋Šฅ ํ‰๊ฐ€ํ•œ๋‹ค. 
  • ํŠน์ • ์ž‘์—…(์˜ˆ: ๊ฒ€์ƒ‰)๋งŒ ์ž˜ํ•˜๋Š” ๋ชจ๋ธ์ด ์•„๋‹ˆ๋ผ, ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ์–ธ์–ด ๊ณผ์ œ์—์„œ ๋‘๋ฃจ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ด๋Š”์ง€ ๊ฐ๊ด€์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•จ. 
  • ๊ณผ๊ฑฐ์—๋Š” ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ œ๊ฐ๊ธฐ ๋‹ค๋ฅธ ๊ธฐ์ค€์œผ๋กœ ํ‰๊ฐ€ํ–ˆ์ง€๋งŒ, MTEB๋Š” ์ด๋ฅผ ํ•˜๋‚˜๋กœ ํ†ตํ•ฉํ•˜์—ฌ ๊ฐœ๋ฐœ์ž๋“ค์ด ๋ชจ๋ธ์˜ ๊ฐ•์ ๊ณผ ์•ฝ์ ์„ ํ•œ๋ˆˆ์— ํŒŒ์•…ํ•˜๊ณ  ๊ณต์ •ํ•˜๊ฒŒ ๋น„๊ตํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•์Šต๋‹ˆ๋‹ค.

ex) ์˜๋ฏธ๋ก ์  ํ…์ŠคํŠธ ์œ ์‚ฌ๋„(STS) ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์ด ํด๋Ÿฌ์Šคํ„ฐ๋ง์ด๋‚˜ ์žฌ์ •๋ ฌ(reranking) ๊ฐ™์€ ๋‹ค๋ฅธ ์ž‘์—…์—์„œ๋„ ๋˜‘๊ฐ™์ด ๋›ฐ์–ด๋‚ ์ง€๋Š” ๋ถˆ๋ถ„๋ช…ํ•จ.

 

์™œ ์„ฑ๋Šฅ ๋ณด์žฅ์ด ์•ˆ๋˜๋Š”๊ฐ€? = ํƒœ์Šคํฌ๋ณ„๋กœ ์š”๊ตฌํ•˜๋Š” '์œ ์‚ฌ๋„'์˜ ์ •์˜๊ฐ€ ๋‹ค๋ฅด๊ธฐ ๋•Œ๋ฌธ"

ํƒœ์Šคํฌ ๋ชฉํ‘œ ํ•„์š”ํ•œ '์œ ์‚ฌ๋„'์˜ ์ •์˜
STS ๋‘ ํ…์ŠคํŠธ์˜ ์˜๋ฏธ์  ์ผ์น˜๋„ ์ธก์ • 1:1 ๋น„๊ต, ๋Œ€์นญ์  ์œ ์‚ฌ์„ฑ
ํด๋Ÿฌ์Šคํ„ฐ๋ง ์ „์ฒด ๋ฐ์ดํ„ฐ์˜ ๊ตฌ์กฐ์  ๊ทธ๋ฃนํ™” ๊ทธ๋ฃน ๋‚ด์  ์‘์ง‘๋„, ์ „์—ญ์ (Global) ์œ ์‚ฌ์„ฑ
๊ฒ€์ƒ‰/์žฌ์ •๋ ฌ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ตœ์ ์˜ ์ •๋‹ต ์ˆœ์œ„ ๋งค๊ธฐ๊ธฐ ์งˆ๋ฌธ-๋‹ต๋ณ€ ๊ด€๊ณ„, ๋น„๋Œ€์นญ์  ๊ด€๋ จ์„ฑ(Relevance)

 

 

MTEB ์˜ ํ‰๊ฐ€ ๋ฐฉ๋ฒ• 

https://arxiv.org/pdf/2210.07316 - MTEB: Massive Text Embedding Benchmark

MTEB๊ฐ€ ๋ฏธ๋ฆฌ ์ค€๋น„ํ•ด ๋‘” ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•ด ๊ฐ ํƒœ์Šคํฌ(๊ฒ€์ƒ‰, ๋ถ„๋ฅ˜, ํด๋Ÿฌ์Šคํ„ฐ๋ง, STS) ๋งˆ๋‹ค ๋งค์šฐ ๊ตฌ์ฒด์ ์ด๊ณ  ์ž๋™ํ™”๋œ ํ‰๊ฐ€ ์ ˆ์ฐจ ๋”ฐ๋ฆ„. 

MTEB ์—์„œ ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ ์…‹: arXiv, bioRxiv (๊ณผํ•™ ๊ธฐ์ˆ  ๋…ผ๋ฌธ), Amazon (์ƒํ’ˆ ๋ฆฌ๋ทฐ, Alexa ๋ช…๋ น์–ด), Twitter, Stack Overflow (๊ฐœ๋ฐœ์ž Q&A), MS MARCO(Bing ๊ฒ€์ƒ‰์—”์ง„ ์‹ค์ œ ๋ฐ์ดํ„ฐ) ๋“ฑ (์ถœ์ฒ˜: MTEB ๋…ผ๋ฌธ )

 

 

๊ฐ ํƒœ์Šคํฌ๋ณ„ ํ‰๊ฐ€ ๋‚ด์šฉ 

 

๐Ÿš€ ๊ฒ€์ƒ‰ (Retrieval)

  • ๋ชฉํ‘œ: ์งˆ๋ฌธ(query)์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ฌธ์„œ(document)๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๋Šฅ๋ ฅ ํ‰๊ฐ€
  • ํ‰๊ฐ€ ๊ณผ์ •:
    1. MTEB๊ฐ€ ๋ฏธ๋ฆฌ ์ค€๋น„ํ•ด ๋‘” ์ˆ˜๋งŽ์€ ๋ฌธ์„œ(Corpus)์™€ ์งˆ๋ฌธ(Queries) ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. (๊ฐ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ •๋‹ต ๋ฌธ์„œ๋Š” ์ด๋ฏธ ์ง€์ •๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.)
    2. ํ…Œ์ŠคํŠธํ•  ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ๋กœ ๋ชจ๋“  ๋ฌธ์„œ์™€ ์งˆ๋ฌธ์„ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
    3. ๊ฐ ์งˆ๋ฌธ ๋ฒกํ„ฐ์™€ ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๋ฌธ์„œ ๋ฒกํ„ฐ ์ˆœ์„œ๋Œ€๋กœ ๋žญํ‚น์„ ๋งค๊น๋‹ˆ๋‹ค.
    4. ์ด ๋žญํ‚น ๊ฒฐ๊ณผ๊ฐ€ ์‹ค์ œ ์ •๋‹ต๊ณผ ์–ผ๋งˆ๋‚˜ ์ผ์น˜ํ•˜๋Š”์ง€ ์ ์ˆ˜๋ฅผ ๋งค๊น๋‹ˆ๋‹ค.
  • ํ•ต์‹ฌ ํ‰๊ฐ€์ง€ํ‘œ (Main Metric): nDCG@10
  • ์˜๋ฏธ: ์ƒ์œ„ 10๊ฐœ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ '์ˆœ์„œ'๊นŒ์ง€ ๊ณ ๋ คํ•œ ์ •ํ™•๋„์ž…๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ์ •๋‹ต์„ 10๊ฐœ ์•ˆ์— ํฌํ•จ์‹œ์ผฐ๋Š”์ง€ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ •๋‹ต์„ ๊ฐ€์žฅ ๋†’์€ ์ˆœ์œ„(1~2์œ„)์— ์˜ฌ๋ ธ๋Š”์ง€๋ฅผ ๋น„์ค‘ ์žˆ๊ฒŒ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. RAG ์„ฑ๋Šฅ์— ๊ฐ€์žฅ ์ด์ƒ์ ์ธ ์ง€ํ‘œ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

๐Ÿ“Š ๋ถ„๋ฅ˜ (Classification)

  • ๋ชฉํ‘œ: ํ…์ŠคํŠธ๋ฅผ ์ฃผ์–ด์ง„ ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ๋‚˜๋ˆ„๋Š” ๋Šฅ๋ ฅ ํ‰๊ฐ€ (์˜ˆ: ์˜ํ™” ๋ฆฌ๋ทฐ๋ฅผ '๊ธ์ •'/'๋ถ€์ •'์œผ๋กœ ๋ถ„๋ฅ˜)
  • ํ‰๊ฐ€ ๊ณผ์ •:
    1. ์ฃผ์–ด์ง„ ํ…์ŠคํŠธ๋“ค์„ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
    2. ์ด ๋ฒกํ„ฐ๋“ค์„ ๊ฐ€์ง€๊ณ  ๊ฐ„๋‹จํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ถ„๋ฅ˜๊ธฐ(๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€)๋ฅผ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค.
    3. ํ•™์Šต๋œ ๋ถ„๋ฅ˜๊ธฐ๊ฐ€ ํ…Œ์ŠคํŠธ์šฉ ํ…์ŠคํŠธ๋“ค์„ ์–ผ๋งˆ๋‚˜ ์ •ํ™•ํ•˜๊ฒŒ ๋ถ„๋ฅ˜ํ•˜๋Š”์ง€ ํ™•์ธํ•ฉ๋‹ˆ๋‹ค.
  • ํ•ต์‹ฌ ํ‰๊ฐ€์ง€ํ‘œ (Main Metric): Accuracy (์ •ํ™•๋„)

๐Ÿงฉ ํด๋Ÿฌ์Šคํ„ฐ๋ง (Clustering)

  • ๋ชฉํ‘œ: ๋น„์Šทํ•œ ์ฃผ์ œ์˜ ํ…์ŠคํŠธ๋ผ๋ฆฌ ๊ทธ๋ฃน์œผ๋กœ ๋ฌถ๋Š” ๋Šฅ๋ ฅ ํ‰๊ฐ€
  • ํ‰๊ฐ€ ๊ณผ์ •:
    1. ๋ชจ๋“  ํ…์ŠคํŠธ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
    2. K-ํ‰๊ท (k-means)๊ณผ ๊ฐ™์€ ํ‘œ์ค€ ํด๋Ÿฌ์Šคํ„ฐ๋ง ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ๋ฒกํ„ฐ๋“ค์„ ๊ทธ๋ฃน์œผ๋กœ ๋‚˜๋ˆ•๋‹ˆ๋‹ค.
    3. ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋งŒ๋“  ๊ทธ๋ฃน์ด ์‹ค์ œ ์ •๋‹ต ๊ทธ๋ฃน๊ณผ ์–ผ๋งˆ๋‚˜ ์ผ์น˜ํ•˜๋Š”์ง€ ์ ์ˆ˜๋ฅผ ๋งค๊น๋‹ˆ๋‹ค.
  • ํ•ต์‹ฌ ํ‰๊ฐ€์ง€ํ‘œ (Main Metric): v-measure

โš–๏ธ ์˜๋ฏธ๋ก ์  ํ…์ŠคํŠธ ์œ ์‚ฌ๋„ (STS)

  • ๋ชฉํ‘œ: ๋‘ ๋ฌธ์žฅ์ด ์˜๋ฏธ์ ์œผ๋กœ ์–ผ๋งˆ๋‚˜ ๋น„์Šทํ•œ์ง€ ์ธก์ •ํ•˜๋Š” ๋Šฅ๋ ฅ ํ‰๊ฐ€
  • ํ‰๊ฐ€ ๊ณผ์ •:
    1. ๋‘ ๋ฌธ์žฅ์„ ๊ฐ๊ฐ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค.
    2. ๋‘ ๋ฒกํ„ฐ ๊ฐ„์˜ ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค.
    3. ์ด ๊ณ„์‚ฐ๋œ ์œ ์‚ฌ๋„ ์ ์ˆ˜๊ฐ€ ์‚ฌ๋žŒ์ด ์ง์ ‘ ๋งค๊ธด ์‹ค์ œ ์œ ์‚ฌ๋„ ์ ์ˆ˜์™€ ์–ผ๋งˆ๋‚˜ ์œ ์‚ฌํ•œ ๊ฒฝํ–ฅ์„ ๋ณด์ด๋Š”์ง€(์ƒ๊ด€๊ด€๊ณ„)๋ฅผ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค.
  • ํ•ต์‹ฌ ํ‰๊ฐ€์ง€ํ‘œ (Main Metric): Spearman correlation (์Šคํ”ผ์–ด๋งŒ ์ƒ๊ด€๊ณ„์ˆ˜)

 

 

MTEB ๋กœ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์ˆœ์œ„ ํ™•์ธํ•˜๊ธฐ 

 

RAG ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ์— ์žˆ์–ด์„œ ์ ํ•ฉํ•œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์ฐพ๊ธฐ ์œ„ํ•ด  ์•„๋ž˜์™€ ๊ฐ™์ด ์„ธํŒ…ํ•ด๋ณด์•˜๋‹ค. 

 

Task Type: Retrieval (๊ฒ€์ƒ‰) : RAG์˜ ํ•ต์‹ฌ  

Doman: Non-fiction : ์šฐ๋ฆฌ ํ”„๋กœ์ ํŠธ์˜ ๋ชฉํ‘œ๋Š” "์ผ์ƒ ๋Œ€ํ™”" ์ด๊ธฐ ๋•Œ๋ฌธ์— ํŠน์ • ๋„๋ฉ”์ธ์ด ์•„๋‹Œ ๋ฒ”์šฉ์„ฑ์„ ์ถ”๊ตฌํ•˜๊ธฐ ์œ„ํ•จ. 

Modality : text 

Language : Kor 

Task : KLUE-STS, Ko-StrategyQA, KorSTS, MIRACLRetrieval 

 

KLUE-STS (Korean Language Understanding Evaluation - Semantic Textual Similarity ) 

- ํ•œ๊ตญ์–ด ์ดํ•ด ๋Šฅ๋ ฅ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๋Œ€ํ‘œ์ ์ธ ์ข…ํ•ฉ ๋ฒค์น˜๋งˆํฌ 'KLUE'**์— ํฌํ•จ๋œ, ๋ฌธ์žฅ ์œ ์‚ฌ๋„ ์ธก์ • ์‹œํ—˜

 

Ko-StrategyQA  (Korean Strategy Question Answering )

- ์—ฌ๋Ÿฌ ๋‹จ๊ณ„์˜ ์ถ”๋ก ์ด ํ•„์š”ํ•œ ๋ณต์žกํ•œ ์งˆ๋ฌธ-๋‹ต๋ณ€(QA) ๋ฐ์ดํ„ฐ์…‹์˜ ํ•œ๊ตญ์–ด ๋ฒ„์ „

 

KorSTS (Korean Semantic Textual Similarity) 

- KLUE-STS์™€ ๋™์ผํ•˜๊ฒŒ ๋‘ ๋ฌธ์žฅ ๊ฐ„์˜ ์˜๋ฏธ์  ์œ ์‚ฌ๋„๋ฅผ ํ‰๊ฐ€ 

- ์„œ๋กœ ๋‹ค๋ฅธ ์ถœ์ฒ˜์˜ ๋ฐ์ดํ„ฐ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์–ด, ๋ชจ๋ธ์˜ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๊ต์ฐจ ๊ฒ€์ฆํ•˜๋Š” ์—ญํ• 

 

MIRACLRetrieval (Multilingual Information Retrieval Across Corpus & Languages)

- 18๊ฐœ์˜ ๋‹ค์–‘ํ•œ ์–ธ์–ด์— ๋Œ€ํ•ด ์ •๋ณด ๊ฒ€์ƒ‰ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ๋‹ค๊ตญ์–ด ๊ฒ€์ƒ‰ ๋ฒค์น˜๋งˆํฌ

 

 

MTEB ์ˆœ์œ„ 

 

๊ฒฐ๋ก ์ ์œผ๋กœ ์œ„ ํ•„ํ„ฐ๋ง์„ ๊ฑฐ์นœ ๋ชจ๋ธ ๋ชฉ๋ก์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 

  • PwC-Embedding_expr
  • jina-embeddings-v3
  • multilingual-e5-large-instruct
  • snowflake-arctic-embed-l-v2.0
  • Solon-embeddings-large-0.1
  • gte-multilingual-base
  • STS-multilingual-mpnet-base-v2
  • bilingual-embedding-base
  • multilingual-e5-base
  • Arabic-all-nli-triplet-Matryoshka

์ด ์ค‘์—์„œ, ํ•œ๊ตญ์–ด ์ง€์› ์—ฌ๋ถ€, ๋ผ์ด์„ ์Šค ์—ฌ๋ถ€ ๋“ฑ์„ ๋”ฐ์ ธ์„œ ์‚ฌ์šฉ ๋ถˆ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ์„ ๊ฑธ๋Ÿฌ๋‚ธ ์ตœ์ข… ๋ชจ๋ธ 3๊ฐ€์ง€๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 

 

1. snowflake-arctic-embed-l-v2.0

https://huggingface.co/Snowflake/snowflake-arctic-embed-l-v2.0

 

Snowflake/snowflake-arctic-embed-l-v2.0 · Hugging Face

Snowflake's Arctic-embed-l-v2.0 News Models Snowflake arctic-embed-l-v2.0 is the newest addition to the suite of embedding models Snowflake has released optimizing for retrieval performance and inference efficiency. Arctic Embed 2.0 introduces a new standa

huggingface.co

 

2. multilingual-e5-large-instruct

https://huggingface.co/intfloat/multilingual-e5-large-instruct

 

intfloat/multilingual-e5-large-instruct · Hugging Face

Multilingual-E5-large-instruct Multilingual E5 Text Embeddings: A Technical Report. Liang Wang, Nan Yang, Xiaolong Huang, Linjun Yang, Rangan Majumder, Furu Wei, arXiv 2024 This model has 24 layers and the embedding size is 1024. Usage Below are examples t

huggingface.co

 

3. PwC-Embedding_expr

https://huggingface.co/SamilPwC-AXNode-GenAI/PwC-Embedding_expr

 

SamilPwC-AXNode-GenAI/PwC-Embedding_expr · Hugging Face

 

huggingface.co

 

 

 

+ ํ•œ๊ตญ์–ด ํŠนํ™” ๋ชจ๋ธ ์ถ”๊ฐ€ 

์•„๋ž˜ ์ฃผ์†Œ๋Š” ํ•œ๊ตญ์–ด ํŠนํ™”๋œ ์˜คํ”ˆ์†Œ์Šค ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์ˆœ์œ„๋ฅผ ํ™•์ธํ•ด๋ณผ์ˆ˜ ์žˆ๋Š” ๋ฆฌ๋”๋ณด๋“œ์ด๋‹ค.  

MTEB ๋ฅผ ์ปค์Šคํ…€ํ•ด์„œ ์ œ์ž‘๋œ ์‚ฌ์ดํŠธ์ด๋ฉฐ MTEB ์—์„œ ๋ฐœ๊ฒฌํ•˜์ง€ ๋ชปํ–ˆ๋˜ ํ•œ๊ตญ์–ด ๋ชจ๋ธ์„ ๋ฐœ๊ฒฌํ–ˆ๋‹ค 

 

https://github.com/OnAnd0n/ko-embedding-leaderboard

 

GitHub - OnAnd0n/ko-embedding-leaderboard: Korean-MTEB

Korean-MTEB. Contribute to OnAnd0n/ko-embedding-leaderboard development by creating an account on GitHub.

github.com

 

 

๊ทธ ์ค‘ ๋‚ด๊ฐ€ ์ตœ์ข…์ ์œผ๋กœ ์„ ์ •ํ–ˆ๋˜ ์„ธ๊ฐ€์ง€ ๋ชจ๋ธ๊ณผ ๋น„์Šทํ•œ ์ ์ˆ˜๋ฅผ ์–ป์€ ์•„๋ž˜ ๋‘๊ฐœ์˜ ๋ชจ๋ธ์„ ๊ฐ™์ด ๋น„๊ตํ•ด ๋ณด๊ณ ์ž ํ•œ๋‹ค. 

 

1. dragonkue/snowflake-arctic-embed-l-v2.0-ko

https://huggingface.co/dragonkue/snowflake-arctic-embed-l-v2.0-ko

 

dragonkue/snowflake-arctic-embed-l-v2.0-ko · Hugging Face

SentenceTransformer based on Snowflake/snowflake-arctic-embed-l-v2.0 This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-l-v2.0 on the clustered datasets. It maps sentences & paragraphs to a 1024-dimensional dense vector s

huggingface.co

 

 

2. nlpai-lab/KURE-v1

https://huggingface.co/nlpai-lab/KURE-v1

 

nlpai-lab/KURE-v1 · Hugging Face

๐Ÿ”Ž KURE-v1 Introducing Korea University Retrieval Embedding model, KURE-v1 It has shown remarkable performance in Korean text retrieval, speficially overwhelming most multilingual embedding models. To our knowledge, It is one of the best publicly opened

huggingface.co

 

 

 

RAG ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์ตœ์ข… ํ›„๋ณด ๋น„๊ต

๊ตฌ๋ถ„ snowflake-arctic-embed-l-v2.0 multilingual-e5-large-instruct PwC-Embedding_expr dragonkue/snowflake-arctic-embed-l-v2.0-ko nlpai-lab/KURE-v1
๋ฆด๋ฆฌ์ฆˆ 24๋…„ 12์›” 24๋…„ 25๋…„ 8์›”  25๋…„ 3์›”   24๋…„ 12์›”
์š”๊ธˆ ๋ฌด๋ฃŒ ๋ฌด๋ฃŒ ๋ฌด๋ฃŒ ๋ฌด๋ฃŒ  ๋ฌด๋ฃŒ
๋ผ์ด์„ ์Šค Apache 2.0 MIT Apache 2.0 Apache 2.0 MIT
์ง€์› ์–ธ์–ด O / ๋‹ค๊ตญ์–ด๋ชจ๋ธ O / ๋‹ค๊ตญ์–ด๋ชจ๋ธ O / ํ•œ๊ตญ์–ด ํŠนํ™”  O / ํ•œ๊ตญ์–ด ํŠนํ™”   O / ํ•œ๊ตญ์–ด ํŠนํ™”
๋ชจ๋ธ ํฌ๊ธฐ  568M 560M 560M 568M 568M
ํŒŒ์ผ ํฌ๊ธฐ  2.27GB 1.12GB 2.4GB 2.27 GB 2.27 GB
๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜ 1024 1024 1024 1024 1024 
CPU ์‚ฌ์šฉ์„ฑ ๋А๋ฆด ์ˆ˜ ์žˆ์Œ ์ƒ๋Œ€์ ์œผ๋กœ ๊ฐ€์žฅ ์–‘ํ˜ธ ๋А๋ฆด ์ˆ˜ ์žˆ์Œ  ๋А๋ฆด ์ˆ˜ ์žˆ์Œ ๋А๋ฆด ์ˆ˜ ์žˆ์Œ
Retrieval
๊ฒ€์ƒ‰ ์ ์ˆ˜
80.45 (1์œ„) 80.35 (2์œ„) 79.69 (3์œ„)  78.13   75.67

 

8. ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ํ…Œ์ŠคํŠธ 

- ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ๋ชฉํ‘œ๋Š” "์˜๋ฏธ ์žˆ๋Š” ๊ด€๊ณ„๊ฐ€ ๋ณด์กด"๋˜๋Š” ์—ฐ์† ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ. 

- ์‹ค์ œ๋กœ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ํ•™์Šต ํ”„๋กœ์„ธ์Šค์—๋Š” ์„ ํƒํ•œ ๋ชฉ์  ํ•จ์ˆ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์˜ˆ์ธก ๊ฐ’๊ณผ ์‹ค์ œ ๊ฐ’ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ตœ์†Œํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์กฐ์ •ํ•˜๋Š” ์ž‘์—…์ด ํฌํ•จ๋œ๋‹ค. 

 

 

ํ…Œ์ŠคํŠธ ํ™˜๊ฒฝ 

 

1. LLM ๋ชจ๋ธ 

์šฐ์„  llm ๋ชจ๋ธ์€ K-intelligence/Midm-2.0-Mini-Instruct

vllm ์— ์„œ๋น™ํ•ด๋†“๊ณ  ํ…Œ์ŠคํŠธ ํ–ˆ๋‹ค. 

 

 

2. ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ 

#1 

๋”๋ณด๊ธฐ

#๋ฐ์ดํ„ฐ ์†Œ์Šค 

CORPUS = [
    "PwC-Embedding_expr ๋ชจ๋ธ์€ multilingual-e5-large-instruct๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ๊ตญ์–ด STS ๋ฐ์ดํ„ฐ์…‹์„ ์ฆ๊ฐ•ํ•˜์—ฌ ๋ฏธ์„ธ์กฐ์ •ํ•œ ๋ชจ๋ธ์ด๋‹ค.",
    "multilingual-e5-large-instruct ๋ชจ๋ธ์€ MIT ๋ผ์ด์„ ์Šค๋ฅผ ๋”ฐ๋ฅด๋ฉฐ, ํŒŒ์ผ ํฌ๊ธฐ๋Š” 1.12GB์ด๋‹ค.",
    "snowflake-arctic-embed-l-v2.0 ๋ชจ๋ธ์˜ ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 8192์ด๋ฉฐ, ๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜๋Š” 1024์ด๋‹ค.",
    "RAG ์‹œ์Šคํ…œ์—์„œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ๊ฒ€์ƒ‰(Retrieval) ์ •ํ™•๋„์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์นœ๋‹ค.",
    "CPU์—์„œ ๋Œ€์šฉ๋Ÿ‰ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๊ฒฝ์šฐ, ์‘๋‹ต ์†๋„๊ฐ€ ์ƒ๋‹นํžˆ ๋А๋ ค์งˆ ์ˆ˜ ์žˆ๋‹ค."
]

 

#ํ…Œ์ŠคํŠธ ์งˆ๋ฌธ 

QUESTIONS = [
    "PwC ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ ์–ด๋–ค ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ๋‚˜์š”?",
    "CPU์—์„œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ๋Œ๋ฆฌ๋ฉด ์–ด๋–ป๊ฒŒ ๋˜๋‚˜์š”?",
    "e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”?",
    "๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?"
]

 

์†Œ์š” ์‹œ๊ฐ„ ๊ฒฐ๊ณผ 

๋ชจ๋ธ ์ด๋ฆ„ ๋ฒกํ„ฐ DB ์ƒ์„ฑ ์‹œ๊ฐ„ (์ดˆ)
(๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ ์†๋„)
์งˆ๋ฌธ๋‹น ํ‰๊ท  ๋‹ต๋ณ€ ์ƒ์„ฑ ์‹œ๊ฐ„ (์ดˆ)
(์‚ฌ์šฉ์ž ์ฒด๊ฐ ์†๋„)
๋‹ต๋ณ€ ํ’ˆ์งˆ
multilingual-e5-large-instruct 0.20 0.30 ๋งค์šฐ ์šฐ์ˆ˜
SamilPwC-AXNode-GenAI/PwC-Embedding_expr 0.21 0.29 ์šฐ์ˆ˜ (๊ฐ„๊ฒฐ)
dragonkue/snowflake-arctic-embed-l-v2.0-ko 0.21 0.29 ์šฐ์ˆ˜ (๊ฐ„๊ฒฐ)
nlpai-lab/KURE-v1 0.21 0.43 ๋งค์šฐ ์šฐ์ˆ˜
(์ƒ์„ธ)
Snowflake/snowflake-arctic-embed-l-v2.0 0.27 0.43 ๋งค์šฐ ์šฐ์ˆ˜
(์ƒ์„ธ)

 

# 1 ๋ชจ๋ธ๋ณ„ ๋‹ต๋ณ€ ๋น„๊ต 

์งˆ๋ฌธ (Question) Snowflake ์›๋ณธ e5-large-instruct PwC-expr dragonkue-ko KURE-v1
PwC ๋ชจ๋ธ์˜ ๊ธฐ๋ฐ˜์€? PwC ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ multilingual-e5-large-instruct ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ํ•œ๊ตญ์–ด STS ๋ฐ์ดํ„ฐ์…‹์„ ์ฆ๊ฐ•ํ•˜์—ฌ ๋ฏธ์„ธ์กฐ์ •๋œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. PwC ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ multilingual-e5-large-instruct ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค. PwC ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ multilingual-e5-large-instruct ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค. PwC ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ multilingual-e5-large-instruct ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค. PwC ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ multilingual-e5-large-instruct ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค.
CPU์—์„œ ๋Œ๋ฆฌ๋ฉด? # CPU์—์„œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์‹คํ–‰ ์‹œ ์„ฑ๋Šฅ ๋ฌธ์ œ CPU์—์„œ ๋Œ€์šฉ๋Ÿ‰ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๊ฒฝ์šฐ, ์‘๋‹ต ์†๋„๊ฐ€ ์ƒ๋‹นํžˆ ๋А๋ ค์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์ด ์ผ๋ฐ˜์ ์œผ๋กœ GPU์™€ ๊ฐ™์€ ์ „์šฉ ํ•˜๋“œ์›จ์–ด์—์„œ ๋” ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌ๋˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋ฌธ์„œ์— ๋”ฐ๋ฅด๋ฉด, ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ๊ฒ€์ƒ‰(Retrieval) ์ •ํ™•๋„์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์น˜๋ฏ€๋กœ, CPU ํ™˜๊ฒฝ์—์„œ๋Š” ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ๋•Œ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. CPU์—์„œ ๋Œ€์šฉ๋Ÿ‰ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๊ฒฝ์šฐ, ์‘๋‹ต ์†๋„๊ฐ€ ์ƒ๋‹นํžˆ ๋А๋ ค์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. CPU์—์„œ ๋Œ€์šฉ๋Ÿ‰ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๊ฒฝ์šฐ, ์‘๋‹ต ์†๋„๊ฐ€ ์ƒ๋‹นํžˆ ๋А๋ ค์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. CPU์—์„œ ๋Œ€์šฉ๋Ÿ‰ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๊ฒฝ์šฐ, ์‘๋‹ต ์†๋„๊ฐ€ ์ƒ๋‹นํžˆ ๋А๋ ค์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. # CPU์—์„œ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์‹คํ–‰ ์‹œ ์„ฑ๋Šฅ ๋ฌธ์ œ CPU์—์„œ ๋Œ€์šฉ๋Ÿ‰ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ๊ฒฝ์šฐ, ์‘๋‹ต ์†๋„๊ฐ€ ์ƒ๋‹นํžˆ ๋А๋ ค์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์ด ์ผ๋ฐ˜์ ์œผ๋กœ GPU์—์„œ ๋” ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌ๋˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋ฌธ์„œ์— ๋”ฐ๋ฅด๋ฉด, ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ๊ฒ€์ƒ‰(Retrieval) ์ •ํ™•๋„์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์น˜๋ฏ€๋กœ, CPU ํ™˜๊ฒฝ์—์„œ๋Š” ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ๋•Œ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š”? e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š” MIT ๋ผ์ด์„ ์Šค์ž…๋‹ˆ๋‹ค. e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š” MIT ๋ผ์ด์„ ์Šค์ž…๋‹ˆ๋‹ค. e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š” MIT ๋ผ์ด์„ ์Šค์ž…๋‹ˆ๋‹ค. e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š” MIT ๋ผ์ด์„ ์Šค์ž…๋‹ˆ๋‹ค. e5 ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค๋Š” MIT ๋ผ์ด์„ ์Šค์ž…๋‹ˆ๋‹ค.
๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋ชจ๋ธ์€? ๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์€ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 8192์ด๋ฉฐ, ๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜๋Š” 1024์ž…๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์€ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 8192๋กœ, ์ œ๊ณต๋œ ๋ชจ๋ธ๋“ค ์ค‘ ๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์€ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 8192์ด๋ฉฐ, ๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜๋Š” 1024์ž…๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์€ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 8192์ด๋ฉฐ, ๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜๋Š” 1024์ž…๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๊ธด ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์€ 'snowflake-arctic-embed-l-v2.0' ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์˜ ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 8192์ด๋ฉฐ, ๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜๋Š” 1024์ž…๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ ์š”์•ฝ:  ์ •๋‹ต์ด ๋ช…ํ™•ํ•œ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ํ…Œ์ŠคํŠธ์—์„œ๋Š” ๋ชจ๋“  ๋ชจ๋ธ์ด 100% ์ •ํ™•ํ•œ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ–ˆ์ง€๋งŒ, ๋‹ต๋ณ€์˜ '์ƒ์„ธํ•จ'์—์„œ ๊ฐ ๋ชจ๋ธ์˜ ์Šคํƒ€์ผ ์ฐจ์ด ๋“œ๋Ÿฌ๋‚จ. 

 

์šฐ์ˆ˜ํ•œ ๋ชจ๋ธ: Snowflake/snowflake-arctic-embed-l-v2.0 / nlpai-lab/KURE-v1

์ด์œ  : ๋‹จ์ˆœํžˆ ์ •๋‹ต๋งŒ ์ œ์‹œํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด, ์‚ฌ์šฉ์ž๊ฐ€ ๊ถ๊ธˆํ•ดํ•  ๋งŒํ•œ ๊ด€๋ จ ์ •๋ณด(์˜ˆ: ๋ฒกํ„ฐ ์ฐจ์› ์ˆ˜, GPU๊ฐ€ ๋” ํšจ์œจ์ ์ธ ์ด์œ  ๋“ฑ)๋ฅผ ์ถ”๊ฐ€๋กœ ์ œ๊ณตํ•˜์—ฌ LLM์ด ๋” ์นœ์ ˆํ•œ ๋‹ต๋ณ€์„ ๋งŒ๋“ค๋„๋ก ์œ ๋„

๋‚˜๋จธ์ง€ ๋ชจ๋ธ์€ ์งˆ๋ฌธ์— ์š”์ง€์— ๋Œ€ํ•œ ํ•ต์‹ฌ ์ •๋ณด๋งŒ ์ •ํ™•ํ•˜๊ฒŒ ์ „๋‹ฌ. 

 

 

#2 

๋”๋ณด๊ธฐ

#๋ฐ์ดํ„ฐ ์†Œ์Šค 

CORPUS = [
    # ๋ฌธ์„œ 1: ๋ฒ ์ด์ง ์š”๊ธˆ์ œ ์„ค๋ช… (์˜๋ฏธ๋ก ์  ๊ฒ€์ƒ‰ ํƒ€๊ฒŸ)
    "์›” 9,900์›์˜ ๋ฒ ์ด์ง ์š”๊ธˆ์ œ๋Š” ๊ด‘๊ณ ๊ฐ€ ํฌํ•จ๋˜๋ฉฐ, ๋™์‹œ์— ํ•œ ๋ช…๋งŒ ์ ‘์†ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.",
    # ๋ฌธ์„œ 2: ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ ์„ค๋ช… (์ •๋ณด ์ถ”์ถœ ํƒ€๊ฒŸ)
    "ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ์›” 15,900์›์œผ๋กœ, 4K ์ดˆ๊ณ ํ™”์งˆ์„ ์ง€์›ํ•˜๋ฉฐ ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ฝ˜ํ…์ธ ๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์—ฌ ์˜คํ”„๋ผ์ธ์—์„œ ์‹œ์ฒญํ•˜๋Š” ๊ธฐ๋Šฅ๋„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.",
    # ๋ฌธ์„œ 3: ํ™˜๋ถˆ ๋ฐ ํ•ด์ง€ ์ •์ฑ… (๋™์˜์–ด/๋ฐ”๊ฟ”์“ฐ๊ธฐ ํƒ€๊ฒŸ)
    "๊ตฌ๋… ์„œ๋น„์Šค์˜ ์ค‘๋„ ํ•ด์ง€๋Š” ์–ธ์ œ๋“ ์ง€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์œ„์•ฝ๊ธˆ์ด๋‚˜ ๋ณ„๋„์˜ ์ˆ˜์ˆ˜๋ฃŒ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ฒฐ์ œ ํ›„ 7์ผ ์ด๋‚ด ์ฝ˜ํ…์ธ  ์‹œ์ฒญ ๊ธฐ๋ก์ด ์—†๋Š” ๊ฒฝ์šฐ์— ํ•œํ•ด ์ „์•ก ํ™˜๋ถˆ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.",
    # ๋ฌธ์„œ 4: ๋ฌด๋ฃŒ ์ฒดํ—˜ ์ด๋ฒคํŠธ (์• ๋งคํ•จ ๊ตฌ๋ถ„ ํƒ€๊ฒŸ)
    "์‹ ๊ทœ ๊ฐ€์ž…์ž๋Š” ์ฒซ ๋‹ฌ์— ํ•œํ•ด ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋ฅผ ๋ฌด๋ฃŒ๋กœ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌด๋ฃŒ ์ฒดํ—˜ ๊ธฐ๊ฐ„์ด ๋๋‚˜๋ฉด ์ž๋™์œผ๋กœ ์œ ๋ฃŒ ๊ฒฐ์ œ๋กœ ์ „ํ™˜๋˜๋‹ˆ ์ฃผ์˜๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค."
]


#ํ…Œ์ŠคํŠธ ์งˆ๋ฌธ 
QUESTIONS = [
    # ์งˆ๋ฌธ 1: '๊ด‘๊ณ  ์—†์ด'๋ผ๋Š” ํ‚ค์›Œ๋“œ๋Š” ์—†์ง€๋งŒ, ์˜๋ฏธ์ ์œผ๋กœ ๊ด€๋ จ๋œ ๋ฌธ์„œ๋ฅผ ์ฐพ์•„์•ผ ํ•จ
    "๊ด‘๊ณ  ์•ˆ ๋ณด๊ณ  ์‹ถ์œผ๋ฉด ์–ด๋–ค ์š”๊ธˆ์ œ๋ฅผ ์จ์•ผ ํ•˜๋‚˜์š”?",
    # ์งˆ๋ฌธ 2: ๊ธด ๋ฌธ๋‹จ ์†์—์„œ '4๊ฐœ'๋ผ๋Š” ํŠน์ • ์ •๋ณด๋ฅผ ์ •ํ™•ํžˆ ์ฐพ์•„๋‚ด์•ผ ํ•จ
    "ํ•œ ๊ณ„์ •์— ํ”„๋กœํ•„์€ ์ด ๋ช‡ ๊ฐœ๊นŒ์ง€ ๋งŒ๋“ค ์ˆ˜ ์žˆ์–ด์š”?",
    # ์งˆ๋ฌธ 3: '๋ฒŒ๊ธˆ'๊ณผ '์œ„์•ฝ๊ธˆ'์ด ๊ฐ™์€ ์˜๋ฏธ์ž„์„ ํŒŒ์•…ํ•ด์•ผ ํ•จ
    "๊ตฌ๋… ์ค‘๊ฐ„์— ์ทจ์†Œํ•˜๋ฉด ๋ฒŒ๊ธˆ์„ ๋‚ด์•ผ ํ•˜๋‚˜์š”?",
    # ์งˆ๋ฌธ 4: '๋ฌด๋ฃŒ ์š”๊ธˆ์ œ'์™€ '๋ฌด๋ฃŒ ์ฒดํ—˜'์˜ ์ฐจ์ด๋ฅผ ๊ตฌ๋ถ„ํ•ด์•ผ ํ•จ (๊ฐ€์žฅ ์–ด๋ ค์šด ์งˆ๋ฌธ)
    "์™„์ „ ๋ฌด๋ฃŒ์ธ ์š”๊ธˆ์ œ๋Š” ์—†๋‚˜์š”?"
]

์†Œ์š” ์‹œ๊ฐ„ ๊ฒฐ๊ณผ 

๋ชจ๋ธ ์ด๋ฆ„ ๋ฒกํ„ฐ DB ์ƒ์„ฑ ์‹œ๊ฐ„ (์ดˆ)
(๋ฌธ์„œ ์ž„๋ฒ ๋”ฉ ์†๋„)
์งˆ๋ฌธ๋‹น ํ‰๊ท  ๋‹ต๋ณ€ ์ƒ์„ฑ ์‹œ๊ฐ„ (์ดˆ) (์‚ฌ์šฉ์ž ์ฒด๊ฐ ์†๋„) ๋‹ต๋ณ€ ํ’ˆ์งˆ
multilingual-e5-large-instruct 0.18 0.45 ๋งค์šฐ ์šฐ์ˆ˜
SamilPwC-AXNode-GenAI/PwC-Embedding_expr 0.21 0.39 ๋งค์šฐ ์šฐ์ˆ˜ 
dragonkue/snowflake-arctic-embed-l-v2.0-ko 0.19 0.30 ์šฐ์ˆ˜
nlpai-lab/KURE-v1 0.20 0.30 ์šฐ์ˆ˜
Snowflake/snowflake-arctic-embed-l-v2.0 0.21 0.28 ์šฐ์ˆ˜

 

 

# 2 ๋ชจ๋ธ๋ณ„ ๋‹ต๋ณ€ ๋น„๊ต 

์งˆ๋ฌธ (Question) Snowflake ์›๋ณธ e5-large-instruct PwC-expr dragonkue-ko KURE-v1
๊ด‘๊ณ  ์•ˆ ๋ณด๊ณ  ์‹ถ์œผ๋ฉด ์–ด๋–ค ์š”๊ธˆ์ œ๋ฅผ ์จ์•ผ ํ•˜๋‚˜์š”? ๊ด‘๊ณ ๋ฅผ ๋ณด์ง€ ์•Š์œผ๋ ค๋ฉด ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ ์ด์ƒ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋ฌธ์„œ์— ๋”ฐ๋ฅด๋ฉด, ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ๋ช…์‹œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ด‘๊ณ ๋ฅผ ๋ณด์ง€ ์•Š์œผ๋ ค๋ฉด ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ ์ด์ƒ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๊ด‘๊ณ ๋ฅผ ๋ณด์ง€ ์•Š์œผ๋ ค๋ฉด ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ ์ด์ƒ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๊ด‘๊ณ ๋ฅผ ๋ณด์ง€ ์•Š์œผ๋ ค๋ฉด ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ ์ด์ƒ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๊ด‘๊ณ ๋ฅผ ๋ณด์ง€ ์•Š์œผ๋ ค๋ฉด ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ ์ด์ƒ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
ํ•œ ๊ณ„์ •์— ํ”„๋กœํ•„์€ ์ด ๋ช‡ ๊ฐœ๊นŒ์ง€ ๋งŒ๋“ค ์ˆ˜ ์žˆ์–ด์š”? ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ํ•œ ๊ณ„์ •์— ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ์›” 15,900์›์œผ๋กœ, 4K ์ดˆ๊ณ ํ™”์งˆ์„ ์ง€์›ํ•˜๋ฉฐ ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ํ•œ ๊ณ„์ •์— ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ์›” 15,900์›์œผ๋กœ, 4K ์ดˆ๊ณ ํ™”์งˆ์„ ์ง€์›ํ•˜๋ฉฐ ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ์›” 15,900์›์œผ๋กœ, 4K ์ดˆ๊ณ ํ™”์งˆ์„ ์ง€์›ํ•˜๋ฉฐ ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ตฌ๋… ์ค‘๊ฐ„์— ์ทจ์†Œํ•˜๋ฉด ๋ฒŒ๊ธˆ์„ ๋‚ด์•ผ ํ•˜๋‚˜์š”? ๊ตฌ๋… ์„œ๋น„์Šค์˜ ์ค‘๋„ ํ•ด์ง€๋Š” ์–ธ์ œ๋“ ์ง€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์œ„์•ฝ๊ธˆ์ด๋‚˜ ๋ณ„๋„์˜ ์ˆ˜์ˆ˜๋ฃŒ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ตฌ๋… ์„œ๋น„์Šค์˜ ์ค‘๋„ ํ•ด์ง€๋Š” ์–ธ์ œ๋“ ์ง€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์œ„์•ฝ๊ธˆ์ด๋‚˜ ๋ณ„๋„์˜ ์ˆ˜์ˆ˜๋ฃŒ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ตฌ๋… ์„œ๋น„์Šค์˜ ์ค‘๋„ ํ•ด์ง€๋Š” ์–ธ์ œ๋“ ์ง€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์œ„์•ฝ๊ธˆ์ด๋‚˜ ๋ณ„๋„์˜ ์ˆ˜์ˆ˜๋ฃŒ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ตฌ๋… ์„œ๋น„์Šค์˜ ์ค‘๋„ ํ•ด์ง€๋Š” ์–ธ์ œ๋“ ์ง€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์œ„์•ฝ๊ธˆ์ด๋‚˜ ๋ณ„๋„์˜ ์ˆ˜์ˆ˜๋ฃŒ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ตฌ๋… ์„œ๋น„์Šค์˜ ์ค‘๋„ ํ•ด์ง€๋Š” ์–ธ์ œ๋“ ์ง€ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์œ„์•ฝ๊ธˆ์ด๋‚˜ ๋ณ„๋„์˜ ์ˆ˜์ˆ˜๋ฃŒ๋Š” ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.
์™„์ „ ๋ฌด๋ฃŒ์ธ ์š”๊ธˆ์ œ๋Š” ์—†๋‚˜์š”? ์‹ ๊ทœ ๊ฐ€์ž…์ž๋Š” ์ฒซ ๋‹ฌ์— ํ•œํ•ด ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋ฅผ ๋ฌด๋ฃŒ๋กœ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌด๋ฃŒ ์ฒดํ—˜ ๊ธฐ๊ฐ„์ด ๋๋‚˜๋ฉด ์ž๋™์œผ๋กœ ์œ ๋ฃŒ ๊ฒฐ์ œ๋กœ ์ „ํ™˜๋˜๋‹ˆ ์ฃผ์˜๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋„ค, ์™„์ „ ๋ฌด๋ฃŒ์ธ ์š”๊ธˆ์ œ๋Š” ์—†์Šต๋‹ˆ๋‹ค. ๋ฌธ์„œ์— ๋”ฐ๋ฅด๋ฉด, ๋ฒ ์ด์ง ์š”๊ธˆ์ œ๋Š” ์›” 9,900์›์œผ๋กœ ๊ด‘๊ณ ๊ฐ€ ํฌํ•จ๋˜๋ฉฐ ํ•œ ๋ช…๋งŒ ์ ‘์†ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ์›” 15,900์›์œผ๋กœ, 4K ์ดˆ๊ณ ํ™”์งˆ์„ ์ง€์›ํ•˜๋ฉฐ ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๊ณ , ์ฝ˜ํ…์ธ ๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์—ฌ ์˜คํ”„๋ผ์ธ์—์„œ ์‹œ์ฒญํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ๋„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์‹ ๊ทœ ๊ฐ€์ž…์ž๋Š” ์ฒซ ๋‹ฌ์— ํ•œํ•ด ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋ฅผ ๋ฌด๋ฃŒ๋กœ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ฌด๋ฃŒ ์ฒดํ—˜ ๊ธฐ๊ฐ„์ด ๋๋‚˜๋ฉด ์ž๋™์œผ๋กœ ์œ ๋ฃŒ ๊ฒฐ์ œ๋กœ ์ „ํ™˜๋ฉ๋‹ˆ๋‹ค. ๋„ค, ์™„์ „ ๋ฌด๋ฃŒ์ธ ์š”๊ธˆ์ œ๋Š” ์—†์Šต๋‹ˆ๋‹ค. ๋ฌธ์„œ์— ๋”ฐ๋ฅด๋ฉด, ๋ฒ ์ด์ง ์š”๊ธˆ์ œ๋Š” ์›” 9,900์›์œผ๋กœ ๊ด‘๊ณ ๊ฐ€ ํฌํ•จ๋˜๋ฉฐ, ์Šคํƒ ๋‹ค๋“œ ์š”๊ธˆ์ œ๋ถ€ํ„ฐ๋Š” ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋Š” ์›” 15,900์›์œผ๋กœ ๊ด‘๊ณ  ์—†์ด ์‹œ์ฒญ์ด ๊ฐ€๋Šฅํ•˜๋ฉฐ, 4K ์ดˆ๊ณ ํ™”์งˆ๊ณผ ์ตœ๋Œ€ 4๊ฐœ์˜ ํ”„๋กœํ•„ ์ƒ์„ฑ, ์˜คํ”„๋ผ์ธ ์‹œ์ฒญ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์‹ ๊ทœ ๊ฐ€์ž…์ž๋Š” ์ฒซ ๋‹ฌ์— ํ•œํ•ด ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋ฅผ ๋ฌด๋ฃŒ๋กœ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ฌด๋ฃŒ ์ฒดํ—˜ ๊ธฐ๊ฐ„์ด ๋๋‚˜๋ฉด ์ž๋™์œผ๋กœ ์œ ๋ฃŒ ๊ฒฐ์ œ๋กœ ์ „ํ™˜๋ฉ๋‹ˆ๋‹ค. ์‹ ๊ทœ ๊ฐ€์ž…์ž๋Š” ์ฒซ ๋‹ฌ์— ํ•œํ•ด ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋ฅผ ๋ฌด๋ฃŒ๋กœ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌด๋ฃŒ ์ฒดํ—˜ ๊ธฐ๊ฐ„์ด ๋๋‚˜๋ฉด ์ž๋™์œผ๋กœ ์œ ๋ฃŒ ๊ฒฐ์ œ๋กœ ์ „ํ™˜๋˜๋‹ˆ ์ฃผ์˜๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์‹ ๊ทœ ๊ฐ€์ž…์ž๋Š” ์ฒซ ๋‹ฌ์— ํ•œํ•ด ํ”„๋ฆฌ๋ฏธ์—„ ์š”๊ธˆ์ œ๋ฅผ ๋ฌด๋ฃŒ๋กœ ์ฒดํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฌด๋ฃŒ ์ฒดํ—˜ ๊ธฐ๊ฐ„์ด ๋๋‚˜๋ฉด ์ž๋™์œผ๋กœ ์œ ๋ฃŒ ๊ฒฐ์ œ๋กœ ์ „ํ™˜๋˜๋‹ˆ ์ฃผ์˜๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ ์š”์•ฝ: ๋ฏธ๋ฌ˜ํ•˜๊ณ  ๊นŒ๋‹ค๋กœ์šด ์งˆ๋ฌธ์ด ํฌํ•จ๋œ ์ด ํ…Œ์ŠคํŠธ์—์„œ๋Š” ๋ชจ๋ธ ๊ฐ„์˜ '์˜๋ฏธ ์ดํ•ด ๋Šฅ๋ ฅ'์—์„œ ๊ฒฐ์ •์ ์ธ ์ฐจ์ด๊ฐ€ ๋“œ๋Ÿฌ๋‚ฌ์Œ. 

 

๊ฐ€์žฅ ์„ฑ๋Šฅ ์šฐ์ˆ˜ํ•œ ๋ชจ๋ธ : intfloat/multilingual-e5-large-instruct / SamilPwC-AXNode-GenAI/PwC-Embedding_expr

์ด์œ  : ๊ฐ€์žฅ ์–ด๋ ค์šด ์งˆ๋ฌธ("์™„์ „ ๋ฌด๋ฃŒ์ธ ์š”๊ธˆ์ œ๋Š” ์—†๋‚˜์š”?")์— ๋Œ€ํ•ด, "์—†๋‹ค"๊ณ  ๋ช…ํ™•ํžˆ ๋‹ต๋ณ€ํ•œ ํ›„ ๋Œ€์•ˆ์„ ์ œ์‹œ.

์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ ์˜๋„๋ฅผ ๊ฐ€์žฅ ์ •ํ™•ํ•˜๊ฒŒ ํŒŒ์•…ํ–ˆ์Œ์„ ์˜๋ฏธ

 

์ตœ์ข… ๊ฒฐ๋ก  

 

๊พธ์ค€ํžˆ ๋‹ต๋ณ€ ํ’ˆ์งˆ์ด ์šฐ์ˆ˜ํ•˜๊ณ  

์ž„๋ฒ ๋”ฉํ•˜๋Š” ์†๋„๊ฐ€ ๊ฐ€์žฅ ๋น ๋ฅธ 

 intfloat/multilingual-e5-large-instruct ๋กœ ๊ฒฐ์ • 

๋ชจ๋“  ์ปค๋ฎค๋‹ˆํ‹ฐ์—์„œ ๊พธ์ค€ํžˆ ์–ธ๊ธ‰๋˜๋Š” ์ด์œ ๊ฐ€ ์žˆ๋‹ค. ใ…‹ใ…‹ ๊ตฟ 

 

 

 

์ฐธ๊ณ  

 

์ž„๋ฒ ๋”ฉ์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€์š”? | IBM

์ž„๋ฒ ๋”ฉ์€ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜๋ฏธ๋ก ์ ์ธ ์˜๋ฏธ๊ฐ€ ์žˆ๋Š” ์—ฐ์† ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ ํ…์ŠคํŠธ ๋ฐ ๊ธฐํƒ€ ๊ฐ์ฒด๋ฅผ ์ ์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋Š” ์ˆ˜๋‹จ์ž…๋‹ˆ๋‹ค.

www.ibm.com

 

 

์ž„๋ฒ ๋”ฉ ๊นŠ์ด ํŒŒํ—ค์น˜๊ธฐ: RAG์˜ ํ•ต์‹ฌ ๊ธฐ์ˆ 

ํ˜„๋Œ€์˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์—์„œ Embedding ๊ธฐ์ˆ ์€ ๋งค์šฐ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ž„๋ฒ ๋”ฉ ๊ธฐ์ˆ ์€ ์˜๋ฏธ ๊ธฐ๋ฐ˜ ๊ฒ€์ƒ‰(Semantic Search), ์ถ”์ฒœ(Recommendation), ๊ตฐ์ง‘ํ™”(Clustering) ๋“ฑ ๋‹ค์–‘ํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ

medium.com

 

 

 

LLM ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ

LLM ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์‹œ๋งจํ‹ฑ ์ธํ…”๋ฆฌ์ „์Šค์˜ ์ƒˆ๋กœ์šด ์‹œ๋Œ€ ํ‚ค์›Œ๋“œ๋ฅผ ๋„˜์–ด ๊ฐœ๋…์œผ๋กœ AI ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์€ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ณ  ์ดํ•ดํ•˜๋Š” ๋ฐฉ์‹์— ๊ทผ๋ณธ์ ์ธ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์™”๋‹ค. ์ด ๋ณ€ํ™”์˜ ์ค‘์‹ฌ์—๋Š” ๋Œ€๊ทœ๋ชจ

velog.io

 

 

'LLM' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

Vector Database ๋ฒกํ„ฐ DB  (0) 2025.10.03
'LLM' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€
  • Vector Database ๋ฒกํ„ฐ DB
jennnnna
jennnnna
  • jennnnna
    ๐Ÿ’ป๐Ÿ€Jennna's BLOG
    jennnnna
  • ์ „์ฒด
    ์˜ค๋Š˜
    ์–ด์ œ
    • ๋ถ„๋ฅ˜ ์ „์ฒด๋ณด๊ธฐ (74) N
      • ์ปดํ“จํ„ฐ (1)
        • Operating system ์šด์˜์ฒด์ œ (8)
      • ํ”„๋กœ๊ทธ๋ž˜๋ฐ (5)
        • JAVA (6)
        • PHP (1)
        • Android (7)
        • Apache (1)
        • Python (0)
      • ๊ณต๋ถ€ (15)
        • ์ •๋ณด์ฒ˜๋ฆฌ๊ธฐ์‚ฌ ๊ณต๋ถ€๊ธฐ๋ก (12)
        • TIL (3)
      • AI (2) N
      • TTS (1)
      • LLM (2)
      • RAG (1)
      • ์–ดํ•™ (5)
        • English (5)
        • Japanese (ๆ—ฅๆœฌ่ชž) (0)
      • ๊ธ€์“ฐ๊ธฐ (5)
  • ๋ธ”๋กœ๊ทธ ๋ฉ”๋‰ด

    • ํ™ˆ
    • ๋ฐฉ๋ช…๋ก
  • ๋งํฌ

  • ๊ณต์ง€์‚ฌํ•ญ

  • ์ธ๊ธฐ ๊ธ€

  • ํƒœ๊ทธ

    ์ž๋ฐ”๊ณต๋ถ€
    ์ž๋ฐ”๊ณต์‹๋ฌธ์„œ
    ํ‹ฐ์Šคํ† ๋ฆฌ์ฑŒ๋ฆฐ์ง€
    ์ •๋ณด์ฒ˜๋ฆฌ๊ธฐ์‚ฌ
    ์•ˆ๋“œ๋กœ์ด๋“œ๊ฐœ๋ฐœ
    ์ •๋ณด์ฒ˜๋ฆฌ๊ธฐ์‚ฌํ•„๊ธฐ
    ์ •์ฒ˜๊ธฐ
    ์žฅ์ธํ•œ๊ณผ
    ์•ˆ๋“œ๋กœ์ด๋“œ
    ์šด์˜์ฒด์ œ
    ์˜ค๋ธ”์™„
    ์šด์˜์ฒด์ œ๊ณต๋ถ€
    ๋น„์ „๊ณต์žcs๊ณต๋ถ€
    ๋น„์ „๊ณต์ž๊ฐœ๋ฐœ์ž
    ๋ฌต์€์ง€์ฐธ์น˜๊น€๋ฐฅ
    ์ž๋ฐ”๊ธฐ์ดˆ
    ์นดํŽ˜์•Œ๋ฐ”
    CS์ง€์‹
    ์ž๋ฐ”๋…ํ•™
    cs๊ณต๋ถ€
  • ์ตœ๊ทผ ๋Œ“๊ธ€

  • ์ตœ๊ทผ ๊ธ€

  • hELLOยท Designed By์ •์ƒ์šฐ.v4.10.5
jennnnna
RAG ๊ตฌ์ถ•์„ ์œ„ํ•œ ํ•œ๊ตญ์–ด ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์„ ์ •ํ•˜๊ธฐ
์ƒ๋‹จ์œผ๋กœ

ํ‹ฐ์Šคํ† ๋ฆฌํˆด๋ฐ”