๋ฒกํฐ DB ๋
๋ฒกํฐ DB ์ ์ ๋ฐ ์ญํ
- ์๋ฒ ๋ฉ๋ ๊ณ ์ฐจ์ ๋ฒกํฐ ๋ฐ์ดํฐ(์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์์ํ) ๋ฅผ ์ ์ฅํ๊ณ ํจ์จ์ ์ผ๋ก ๊ฒ์ํ ์ ์๊ฒ ๋์์ฃผ๋ ๋ฐ์ดํฐ ๋ฒ ์ด์ค.
- ๋ฐ์ดํฐ ํฌ์ธํธ(๋ฐ์ดํฐ ์งํฉ ์์ ํฌํจ๋ ํ๋์ ๊ด์ธก์น/ํญ๋ชฉ): ์ซ์ ๋ฐฐ์ด์ธ “๋ฒกํฐ”
- ๋ฒกํฐ์ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ํด๋ฌ์คํฐ๋ง๋จ. → ์ง์ฐ์๊ฐ์ด ์งง์ ์ฟผ๋ฆฌ๋ฅผ ์ง์ํ๊ธฐ ๋๋ฌธ์ AI ์ ํ๋ฆฌ์ผ์ด์ ์ ์ด์์ .
- ์ฌ์ค์ ๋ชจ๋ ๋ฐ์ดํฐ ์ ํ์ ๋ํ ์๋ฏธ๋ก ์ ์๋ฏธ, ํน์ง์ ๊ธฐ๋ฐ์ผ๋ก ํจ๊ป ๊ทธ๋ฃนํ๋๊ฑฐ๋ ๋ฐ๋๋๋ ๊ฒ์ผ๋ก ์๋ณ๋จ.
- ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ RAG ๊ตฌํ์ ์ง์ํ๋ ๋ฐ ํต์ฌ์ ์ธ ์ญํ ์ ํจ.
๋ฒกํฐ์ ํ ์
Vector
- ํ ์์ ํ์ ์งํฉ
- ์ฌ๋ฌ ์ค์นผ๋ผ๋ฅผ ํฌํจํ๋ 1์ฐจ์ ํน์ 1์ฐจ ํ ์. → ์ซ์ ๋ชจ์.
- ex) ๋ ์จ๋ชจ๋ธ์ ํ๋ฃจ๋์์ ์ต์ ์จ๋, ์ต๊ณ ์จ๋, ํ๊ท ์จ๋๋ฅผ ๋ฒกํฐ๋ก ๊ตฌ์ฑ ๊ฐ๋ฅ
- ๊ฐ ์ค์นผ๋ผ๋ ๋ฒกํฐ์ ํน์ง์ด ๋จ. ์ฆ “์ฐจ์”์ผ๋ก ๊ทธ๋ ๋ ์จ(๋ฒกํฐ) ์ ํน์ง์ ๋ํ๋.
Tensor
- ์ ์(์ํ/ML): ํ ์๋ “๋ค์ฐจ์ ๋ฐฐ์ด”์ ์ผ๋ฐํํ ๊ฐ๋ .
- ์ฐจ์์ ๋ฐ๋ผ ์ด๋ฆ์ด ๋ฌ๋ผ์ง
- ์ค์นผ๋ผ(Scalar): 0์ฐจ์ ํ ์ → ๋จ์ผ ์ซ์ (์: 7)
- ๋ฒกํฐ(Vector): 1์ฐจ์ ํ ์ → ์ซ์๋ค์ ๋ฆฌ์คํธ (์: [1, 2, 3])
- ํ๋ ฌ(Matrix): 2์ฐจ์ ํ ์ → ํ๊ณผ ์ด์ ๊ฐ์ง ์ซ์ ๋ฐฐ์ด (์: [[1, 2], [3, 4]])
- 3์ฐจ์ ์ด์ ํ ์: (์: ์ด๋ฏธ์ง RGB ์ฑ๋์ ๋ด์ 3D ๋ฐฐ์ด, [height × width × channel])
๋ฒกํฐ DB ์ฃผ์ ๊ธฐ๋ฅ
1. ๋ฒกํฐ ์คํ ๋ฆฌ์ง ๊ธฐ๋ฅ
๋ฒกํฐ DB ์ ์ ์ฅ๋๋ ๋ด์ฉ
- ๋ฒกํฐ ์๋ฒ ๋ฉ ๋ฐ์ดํฐ, ์ ๋ชฉ, ์ค๋ช ๋ฐ ๋ฐ์ดํฐ ์ ํ์ ํฌํจํ ๊ฐ ๋ฐ์ดํฐ์ ๋ฉํ ๋ฐ์ดํฐ (๋ฉํ ๋ฐ์ดํฐ ํํฐ๋ฅผ ์ฌ์ฉํด ์ฟผ๋ฆฌ์ฒ๋ฆฌ ๊ฐ๋ฅ)
2. ๋ฒกํฐ ์ธ๋ฑ์ฑ ๊ธฐ๋ฅ (๋ฒกํฐ ์ ์ฉ)
์ธ๋ฑ์ค: ๋ฒกํฐ(๊ณ ์ฐจ์ ์ขํ)์ ์ ์ฌ๋๋ฅผ ๋น ๋ฅด๊ฒ ๊ณ์ฐํ๊ธฐ ์ํด ๋ง๋ ํน์ ์๋ฃ๊ตฌ์กฐ.
- ๊ณ ์ฐจ์ ๋ฐ์ดํฐ ๊ณต๊ฐ ๋ด์์ ๊ฒ์ ์๋๋ฅผ ๋์ด๊ธฐ ์ํด์๋ ๋ฒกํฐ ์ธ๋ฑ์ฑ์ ํด์ผํจ.
- ๋ฒกํฐ DB ๋ ๊ฒ์ ๊ธฐ๋ฅ์ ์ํด ๋ฒกํฐ ์๋ฒ ๋ฉ์ “์ธ๋ฑ์ค” ์์ฑํจ.
- ML ์๊ณ ๋ฆฌ์ฆ ์ฌ์ฉํด ๋ฒกํฐ๋ฅผ ์ธ๋ฑ์ฑํจ.
- ์ธ๋ฑ์ฑ: ๋ฒกํฐ๋ฅผ ์๋ก์ด data ๊ตฌ์กฐ์ ๋งคํ → ์ ์ฌ์ฑ/๊ฑฐ๋ฆฌ๊ฒ์์ ๋ ๋น ๋ฅด๊ฒ ํจ.
์ธ๋ฑ์ฑ ์๊ณ ๋ฆฌ์ฆ
- HNSW (๊ณ์ธต์ ํ์ ๊ฐ๋ฅํ ์์ ์ธ๊ณ) : ํธ๋ฆฌ ๊ตฌ์กฐ. ๊ฐ ๋ ธ๋์๋ ๊ฐ ๋ ธ๋์ ๊ณ์ธต์ด ์๋ ๋ฒกํฐ ์งํฉ์ด ํ์๋จ. ๋ฒกํฐ ๊ฐ์ ์ ์ฌ์ฑ์ ๋ ธ๋ ์ฌ์ด์ ๊ฐ์ฅ์๋ฆฌ์ ํ์๋จ.
- LSH (k์ต๊ทผ์ ์ด์๊ฒ์์ ์ฌ์ฉํด ์ฝํ ์ธ ์ธ๋ฑ์ฑ): k์ต๊ทผ์ ์ด์ ๊ฒ์์ ์ฌ์ฉํด ์ธ๋ฑ์ฑ, ์๋๋ฅผ ๋์ด๋ ค๋ฉด ๋๋ต์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํด ์ธ๋ฑ์ค ์ต์ ํ ๊ฐ๋ฅํ์ง๋ง ์์ ํ์ง x
- PQ (๊ฐ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์งง๊ณ ๋ฉ๋ชจ๋ฆฌํจ์จ์ ์ธ ํํ์ผ๋ก ๋ณํ): ๋ชจ๋ ๋ฒกํฐ๊ฐ ์๋ ์งง์ ํํ๋ง ์ ์ฅ.
3. ์ง์ ๋๋ ํ๋กฌํํธ ๊ธฐ๋ฐ ์ ์ฌ์ฑ ๊ฒ์
- ์ฟผ๋ฆฌ(Query) = ์ฌ์ฉ์๊ฐ AI ๋ชจ๋ธ์ ์ฃผ๋ ์ ๋ ฅ (์ง๋ฌธ, ์์ฒญ, ํ๋กฌํํธ)
- ์ฟผ๋ฆฌ ๋ฒกํฐ(Query Vector) = ๊ทธ ์ ๋ ฅ์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ด ๋ฒกํฐ(์ซ์ ๋ฐฐ์ด) ๋ก ๋ณํํ ๊ฒฐ๊ณผ
→ ์ดํ DB ๋ ์ฟผ๋ฆฌ ๋ฒกํฐ์ ์ธ๋ฑ์ค์ ์ ์ฅ๋ ๋ฒกํฐ ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ์ฌ ์ ์ฌํ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํจ.
⇒ ์ถ์ฒ ์์คํ , ์๋งจํฑ ๊ฒ์, ์ด๋ฏธ์ง ์ธ์ ๋ฐ ๊ธฐํ ์์ฐ์ด ์ฒ๋ฆฌ ์์ ๊ณผ ๊ฐ์ ๋ค์ํ ๋จธ์ ๋ฌ๋ ์์ ์ ์ง์
๋ฒกํฐ DB ์ ์ฅ์ .
- ์๋ ๋ฐ ์ฑ๋ฅ : ์ธ๋ฑ์ฑ ๊ธฐ์ ์ ์ฌ์ฉํ ๋น ๋ฅธ ๊ฒ์. ์๋ง๊ฐ์ ๋ฐ์ดํฐ ํฌ์ธํธ ์๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ธํธ์์ ๊ด๋ จ ๊ฒฐ๊ณผ ๊ฒ์ ์ ์ฑ๋ฅ ์ต์ ํ์ ๋์.
- ํ์ฅ์ฑ : ์ถ๊ฐ ๋ ธ๋์ ๋ฐ๋ผ ์ํ์ ์ผ๋ก ํ์ฅํ์ฌ ๋ฐฉ๋ํ ์์ ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ณ ๊ด๋ฆฌํ ์ ์์. ์ฟผ๋ฆฌ ์์์ ๋ฐ์ดํฐ ๋ณผ๋ฅจ์ด ์ฆ๊ฐํ๋๋ผ๋ ์ฑ๋ฅ์ ์ ์งํ ์ ์์.
- ์์ ๋น์ฉ ์ ๊ฐ : ๋ ๋น ๋ฅธ ๋ฐ์ดํฐ ๊ฒ์์ ๊ฐ๋ฅํ๊ฒ ํ๊ธฐ ๋๋ฌธ์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ(์ด๋ฏธ ๋๊ท๋ชจ์ธ ๋ฒ์ฉ ๋ชจ๋ธ) ์ ํ์ต ์๋๋ฅผ ๋์.
- ๋ฒกํฐ DB์ ์๋ฒ ๋ฉ์ ๋ฏธ๋ฆฌ ์ ์ฅํด๋๋ฉด → ์ ์ฌํ ๋ฐ์ดํฐ ๊ฒ์์ ์ ms~์๋ฐฑ ms ๋ด์ ๋๋ผ ์ ์์ = GPU ์ฌ์ฉ ์๊ฐ ์ค์ด๋ค์.
- ํ์ต: ์๋น์ค์ ์ฌ์ฉ๋๋ ๋๊ท๋ชจ ai ๋ชจ๋ธ์ ์ค์ ํ์คํฌ์ ์ ์ฉ·์ ์์ํค๋ ์๋๊ฐ ๋นจ๋ผ์ง๋ค
- ๋ฐ์ดํฐ ๊ด๋ฆฌ : ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์ผ๋ฐ์ ์ผ๋ก ์๋ก์ด ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ์ฝ๊ฒ ์ ๋ฐ์ดํธํ๊ณ ์ฝ์ ํ ์ ์๋ ๊ธฐ๋ฅ์ ๊ธฐ๋ณธ์ผ๋ก ์ ๊ณต
- ์ ์ฐ์ฑ : ์ด๋ฏธ์ง, ๋์์ ๋๋ ๊ธฐํ ๋ค์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ๋ ์ถ๊ฐ๋๋ ๋ณต์ก์ฑ์ ์ฒ๋ฆฌํจ.
๊ธฐ์กด DB ์์ ๋น๊ต
- ํ๊ณผ ์ด์ด ์กด์ฌํ๋ ๊ธฐ์กด ๊ด๊ณํ ๋ฐ์ดํฐ์ ๋ฌ๋ฆฌ, ๋ฐ์ดํฐ ํฌ์ธํธ๋ ๊ณ ์ ๋ ๊ฐ์์ ์ฐจ์์ ๊ฐ์ง ๋ฒกํฐ๋ก ํํ๋จ.
- ๊ด๊ณํ ๋ฐ์ดํฐ ๋ฒ ์ด์ค : ํ row ๊ณผ ์ด column ์ 2์ฐจ์ ํ์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ํํํจ.
- NoSQL (not sql only) : ๊ธฐ์กด ๊ด๊ณํ DB ๋ณด๋ค ๋ฐ์ดํฐ ์ ์ฅ ๋ฐฉ์ ๋ค์ (๋ฌธ์ ๊ธฐ๋ฐ, ํค๊ฐ๊ธฐ๋ฐ, ์ด๊ธฐ๋ฐ ๋ฑ) / ํธ๋์ ์ ์ฒ๋ฆฌ, ๋ฐ์ดํฐ ์ผ๊ด์ฑ ๋ณด์ฅ ์๋์ ์ผ๋ก ์ฝํจ.
- ๋ฒกํฐ ๊ณต๊ฐ์์ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ฉฐ ๊ฐ ๋ฐ์ดํฐ๋ ๊ณ ์ฐจ์ ๋ฒกํฐ๋ก ํํ๋จ. (3์ฐจ์ ์ด์๊ณต๊ฐ)
- ์ฟผ๋ฆฌ ๋ฐฉ์ : ๋ฒกํฐ ์ ์ฌ๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฒ์ = ์๋ฒ ๋ฉ๋ ์ฟผ๋ฆฌ๋ฅผ ๊ฐ์ง๊ณ ์ ์ฌ๋ ๊ฒ์ํจ. ์ฆ, ์์ฐ์ด ์ฒ๋ฆฌ, ์ด๋ฏธ์ง ๊ฒ์ ๋ฑ ๋ณต์กํ ์์ ์ ์ ๋ฆฌ.
๊ธฐ์กด๊ฒ์ ⇒ ํค์๋, ํ๊ทธ ๋๋ ๋ฉํ๋ฐ์ดํฐ์ ๊ฐ์ ๊ฐ๋ณ ํ ํฐ ๊ธฐ๋ฅ ํ์ฉํด ์ ํํ ์ผ์นํ๋ ํญ๋ชฉ ๊ฒฐ๊ณผ๋ก ๋ฐํ.
๋ฒกํฐ ๊ฒ์ ⇒ ๋ฐ์ดํฐ๋ฅผ ๊ณ ๋ฐ๋ ๋ฒกํฐ๋ก ํํํด (์ฐ์ ๋ฒกํฐ ๊ณต๊ฐ) ์ ์ฌ์ฑ ๊ฒ์ ๊ฐ๋ฅ. ์ ์ฌ์ ํน์ง ๋ฐ ์ธก๋ฉด ๊ฒ์ ๊ฐ๋ฅ (*์ ์ฌ์ ํน์ง: ์ง์ ์ ์ผ๋ก ๊ด์ฐฐ๋์ง ์์ผ๋ ์ํ์ ๋ชจ๋ธ์ด๋ ์๊ณ ๋ฆฌ์ฆ ํตํด ๋ฐ์ดํฐ์์ ์ถ๋ก ๋๋ ๊ธฐ๋ณธ์ ์ธ ํน์ฑ์ด๋ ์์ฑ)
๋ฒกํฐ DB, 3์ค ์์ฝ
- ์ ์: AI๋ฅผ ์ํ ๋ฐ์ดํฐ๋ฒ ์ด์ค. ํ ์คํธ, ์ด๋ฏธ์ง ๋ฑ ๋ชจ๋ ๋ฐ์ดํฐ์ '์๋ฏธ'๋ฅผ ์ซ์ ์ขํ(๋ฒกํฐ)๋ก ์ ์ฅ.
- ์ญํ : ๋ด ์ง๋ฌธ๊ณผ '์๋ฏธ๊ฐ ๊ฐ์ฅ ๊ฐ๊น์ด' ๋ฐ์ดํฐ๋ฅผ ์ด๊ณ ์์ผ๋ก ๊ฒ์ (RAG์ ํต์ฌ ์์ง).
- ์ ํ: ํ๋ก์ ํธ ์ํฉ์ ๋ง์ถฐ ๋ ๋ฆฝํ, ํ์ฅํ, ํด๋ผ์ฐ๋ํ ๋ฑ ๋ค์ํ ์ต์ ์ค ์ ํ ๊ฐ๋ฅ.
๋ฒกํฐ DB ์ ๊ฒ์ ์ฆ๊ฐ ์์ฑ (RAG)
- ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ์ธ๋ถ ์ง์ ๊ธฐ๋ฐ์์ ํฉํธ๋ฅผ ๊ฒ์ํ ์ ์๋๋ก ํ๋ AI ํ๋ ์์ํฌ
- RAG๋ ๋ชจ๋ธ์ด ์ ๋ขฐํ ์ ์๋ ์ต์ ํฉํธ์ ์ฐ๊ฒฐ๋๊ณ ์ฌ์ฉ์๊ฐ ๋ชจ๋ธ์ ์์ค์ ์ก์ธ์คํ์ฌ ์ฃผ์ฅ์ ํ์ธํ ์ ์๋๋ก ์ง์
- RAG๋ ๊ณ ์ฐจ์ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ ์ํ ์ปจํ ์คํธ ๋ด ํ์ต์ ์ํด ์๋ฏธ์ ์ผ๋ก ๊ด๋ จ์ฑ์ด ๋์ ์ ๋ณด๋ก ํ๋กฌํํธ๋ฅผ ๊ฐํ
๋ฒกํฐ DB ์ ์ ์ ๊ณ ๋ ค ์ฌํญ
1. ๋ฒกํฐ DB ์ ํ
1) ๋ ๋ฆฝํ ๋ฒกํฐ DB (Standalone Vector DB)
๋ฒกํฐ ๊ฒ์์ ์ํด ์ฒ์๋ถํฐ ์ค๊ณ๋ '๋ฒกํฐ ์ ์ฉ' ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋๋ค. ๋ฒกํฐ ๊ฒ์์ ์ต์ ํ๋ ๋ค์ํ ๊ณ ๊ธ ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
- ์คํ์์ค: Weaviate, Milvus, Qdrant, Chroma
- ๋ ์ /๊ด๋ฆฌํ ์๋น์ค: Pinecone
2) ํ์ฅํ ๊ธฐ์กด DB (Extended Traditional DB)
๊ธฐ์กด์ ๋๋ฆฌ ์ฐ์ด๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ฒกํฐ ๊ฒ์ ๊ธฐ๋ฅ์ 'ํ๋ฌ๊ทธ์ธ'์ด๋ 'ํ์ฅ' ํํ๋ก ์ถ๊ฐํ ๊ฒ์ ๋๋ค.
- A) ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค(RDB) ํ์ฅ: ๊ธฐ์กด RDB ์ธํ๋ผ๋ฅผ ๊ทธ๋๋ก ํ์ฉํ ์ ์๋ ์ฅ์ ์ด ์์ต๋๋ค.
- ์์: PostgreSQL + pgvector ํ์ฅ, MariaDB (์์ฒด ๋ด์ฅ)
- B) ๊ฒ์ ์์ง ํ์ฅ: ์ ํต์ ์ธ ํค์๋ ๊ฒ์๊ณผ ๋ฒกํฐ ๊ธฐ๋ฐ ์๋ฏธ ๊ฒ์์ ๊ฒฐํฉํ 'ํ์ด๋ธ๋ฆฌ๋ ๊ฒ์'์ ๋งค์ฐ ๊ฐ๋ ฅํฉ๋๋ค.
- ์์: Elasticsearch, OpenSearch
3) ๊ฒฝ๋ / ํ์ผ ๊ธฐ๋ฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Lightweight / File-based Library)
๋ณ๋์ ์๋ฒ ์์ด, ์ฝ๋์ ์ง์ ํฌํจํ์ฌ ์ฌ์ฉํ๋ ๊ฐ๋ฒผ์ด ๋ฒกํฐ ๊ฒ์ '๋๊ตฌ'์ ๋๋ค. ๋น ๋ฅธ ํ๋กํ ํ์ดํ์ด๋ ์๊ท๋ชจ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ ํฉํฉ๋๋ค.
- ์์: FAISS
4) ํตํฉ ๋ฐ์ดํฐ ํ๋ซํผ (Integrated Data Platform)
๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค์ฒ๋ผ, ๊ธฐ์ ์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ๋ ๊ฑฐ๋ํ ํ๋ซํผ์ ๋ฒกํฐ ๊ฒ์ ๊ธฐ๋ฅ์ด '๋ด์ฅ ๊ธฐ๋ฅ'์ผ๋ก ํฌํจ๋ ํํ์ ๋๋ค.
- ์์: IBM watsonx.data, Databricks Vector Search, Snowflake Cortex
2. ํ๋ก์ ํธ ์๊ตฌ์ฌํญ
- ์ฌ์ฉ ๊ฐ๋ฅํ ํ๋์จ์ด ์์
- ๋น์ฉ
- ๊ด๋ฆฌ ์ฉ์ด์ฑ: ๊ฐ๋ฐ ํธ๋ฆฌ ํด์ผํจ.
- ๊ฐ๋ฒผ์์ผ ํจ. -> ์ค์๊ฐ ์์ฑ ๋ํ ์ฑ๋ด ์๋น์ค์ ๋ง์์ผ ํจ.
- ์ฑ๋ด ์๋น์ค์์ "๋ํ" ๋ฐ์ดํฐ๋ ์๋น์ค ๊ธฐ๋ฅ(์ญ์ , ๋ณต๊ตฌ, ๋ชฉ๋ก/๊ฒ์, ๊ฐ์ฌ, ๊ถํ)์ ์ง์ ์ฐ์ด๋ฏ๋ก ๊ด๊ณํ DB ์ ์๋ณธ ์ ์ฅ ํ์.
- Chroma ๋ฑ ๋ฒกํฐ DB ์๋ documents ์น์ ์ ์๋ณธ ์ ์ฅํ๋ ๊ธฐ๋ฅ์ด ์์ง๋ง, ์ด์๋จ๊ณ์ ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค, ๊ถํ, ๊ฐ์ฌ, ๋ฆฌํฌํ ์ ๊ฐํ๊ฒ ๋ณด์ฅํ์ง ๋ชปํจ.
- RDB + Vector DB ์ฌ์ฉํ๊ธฐ.
3. ์ฑ๋ฅ
- ๊ฒ์ ์๋
- ์ฒ๋ฆฌ๋
- ๊ฒ์ ์ ํ๋
- ์ธ๋ฑ์ฑ ์๋
๋ฒกํฐ DB ๋ชฉ๋ก
๋ฌด๋ฃ DB ๋ฒกํฐ ์ค ๊ฐ์ฅ ์ธ๊ธ์ด ๋ง์ DB ๋ค์ ๊ฐ์ ธ์ด.
์์ ์ ํํ๋ AI ๋ชจ๋ธ๊ณผ ๋ค๋ฅด๊ฒ ์ฌ๋๋ค์ด ์ค๋ซ๋์ ์ฌ์ฉํ๋ฉฐ ์์ ์ฑ์ด '๊ฒ์ฆ'๋ ๊ธฐ์ ์ ์ ํํ๋ ๊ฒ์ด ํจ์ฌ ๋ ์ค์
| ๋ฒกํฐ DB | 1024 ์ฐจ์ ์ง์ | ๋ฌด๋ฃ ์ฌ์ฉ ๊ฐ๋ฅ ์ฌ๋ถ | ๋น๊ณ |
| Pinecone | โ | โ ๏ธ (์ ํ์ ) | ๋ฌด๋ฃ 'Starter' ํ๋์ด ์์ง๋ง, ์ฉ๋/๊ธฐ๋ฅ์ ์๋นํ ์ ํ์ด ์์ต๋๋ค. |
| Weaviate | โ | โ | ์คํ์์ค. ์ง์ ์๋ฒ์ ์ค์นํ์ฌ ๋ฌด๋ฃ๋ก ์ฌ์ฉ ๊ฐ๋ฅ. |
| Milvus โ | โ | โ | ์คํ์์ค. ์ง์ ์๋ฒ์ ์ค์นํ์ฌ ๋ฌด๋ฃ๋ก ์ฌ์ฉ ๊ฐ๋ฅ. |
| Qdrant | โ | โ | ์คํ์์ค. ์ง์ ์๋ฒ์ ์ค์นํ์ฌ ๋ฌด๋ฃ๋ก ์ฌ์ฉ ๊ฐ๋ฅ. |
| Chroma โ | โ | โ | ์คํ์์ค. ์ง์ ์๋ฒ์ ์ค์นํ๊ฑฐ๋, ํ์ผ ๊ธฐ๋ฐ ๋ ๊ฐ๋ฅ. LangChain๊ณผ์ ํตํฉ์ด ๋งค์ฐ ์ ๋์ด ์์ด |
| PostgreSQL + pgvector โ | โ | โ | PostgreSQL๊ณผ pgvector ๋ชจ๋ ์คํ์์ค. |
| MariaDB | โ | โ | MariaDB Community Server๋ ์คํ์์ค. |
ํ์ฌ๋ก์๋ PostgreSQL + pgvector โ ๊ฐ
์ด์ ๋ฐ์ดํฐ(RDB) ์ ์๋ฏธ ๊ฒ์(๋ฒกํฐ) ๋ฅผ ๋ชจ๋ ์ฒ๋ฆฌํ ์ ์์ด์,
์ด๊ธฐ/์ค์ ๊ท๋ชจ ์๋น์ค์ ๋น์ฉ·๊ด๋ฆฌ·๊ฐ๋ฐ ํธ์์ฑ ์ธก๋ฉด์์ ๊ฐ์ฅ ์ข์ ์ ํ์ด๋ผ๊ณ ์๊ฐ๋จ.
์ฐธ๊ณ
10ํ ๋ฒกํฐ DB๋ ๊ธฐ์กด์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ด๋ป๊ฒ ๋ค๋ฅผ๊น?
2์ฐจ์ ๊ณต๊ฐ์์ ๋ค์ฐจ์ ๊ณต๊ฐ์ผ๋ก ๋ฒ์๋ฅผ ํ์ฅ์ํจ ๋ฒกํฐDB | ์ง๋ ์๊ฐ์๋ ์ ๋ ฅ๋ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ ์ ํ ํฌ๊ธฐ์ ๋ฉ์ด๋ฆฌ๋ก ์ชผ๊ฐ์ด ์ฃผ๋ ์ฒญํน(Chunking)๊ณผ ์ซ์๋ก ๊ตฌ์ฑ๋ ๋ฒกํฐ๋ก ๋ณํํด ์ฃผ๋ ์๋ฒ
brunch.co.kr
Chroma Docs
Documentation for ChromaDB
docs.trychroma.com
'LLM' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| RAG ๊ตฌ์ถ์ ์ํ ํ๊ตญ์ด ์๋ฒ ๋ฉ ๋ชจ๋ธ ์ ์ ํ๊ธฐ (0) | 2025.10.02 |
|---|