Showing posts with the label VectorDB

RAG 응답속도 2초 벽 깨기: HNSW 인덱스 튜닝과 리랭킹(Re-ranking) 최적화 경험

RAG(Retrieval-Augmented Generation) 파이프라인을 구축해 본 엔지니어라면 누구나 마주하는 현실적인 벽이 있습니다. 바로 "정확도를 높이면 속도가 죽고, 속도를 높이면 엉뚱한 문서를 가져온다" 는 딜레마입니다. 특히 사용…
RAG 응답속도 2초 벽 깨기: HNSW 인덱스 튜닝과 리랭킹(Re-ranking) 최적화 경험
OlderHomeNewest