
KAIST가 인공지능(AI)의 최대 약점으로 꼽히는 ‘환각(Hallucination)’ 문제를 크게 줄일 수 있는 차세대 데이터베이스 기술을 개발했다.
이 기술은 문서의 의미와 데이터 간 관계, 정형 정보를 동시에 이해하는 새로운 데이터 인프라를 구축해 AI 답변 정확도를 최대 78% 높이고 처리 속도는 최대 20배 끌어올렸다.
KAIST 전산학부 김민수 교수팀은 교원창업기업 그래파이와 공동으로 벡터 데이터베이스(DB), 그래프 DB, 관계형 DB를 한 시스템으로 통합한 ‘아카식DB(AkasicDB)‘와 이를 기반으로 한 검색증강생성(RAG) 기술 ’옴니RAG(Omni RAG)‘를 개발했다고 19일 밝혔다.
최근 생성형 AI는 기업 내부 문서와 데이터를 검색한 뒤 이를 바탕으로 답변을 만드는 RAG 기술을 중심으로 빠르게 확산하고 있다.
하지만 실제 기업 환경에서는 문서, 데이터베이스, 조직 정보, 계약 관계 등 데이터가 서로 다른 형태로 흩어져 있어 AI가 이를 종합적으로 이해하기 어렵다.
때문에 충분한 근거 없이 사실과 다른 답변을 생성하는 환각 현상이 발생하며 금융·법률·국방·제조 분야에서 AI 도입의 가장 큰 걸림돌로 지적됐다.
현재 대부분의 RAG 시스템은 문서 내용을 숫자 벡터로 변환한 뒤 질문과 의미적으로 유사한 문서를 찾아 대규모언어모델(LLM)에 제공한다.
이 방식은 문서 검색에는 효과적이지만 개체 간 관계나 날짜, 유형, 조건 등이 결합된 복합 질의를 처리하는 데 한계를 보였다.
예를 들어 ‘지난해 체결한 계약서 가운데 A사와 관련된 조항을 찾고 해당 조항이 어떤 제품 공급 문제와 연결되는지 설명해’라는 질문에 답하려면 문서 의미를 찾는 벡터 검색과 기업·제품 간 관계를 추적하는 그래프 검색, 특정 기간을 필터링하는 관계형 질의가 동시에 필요하다.
기존에는 각각 다른 데이터베이스를 구축한 뒤 응용프로그램에서 결과를 결합해야 해 처리 속도가 느리고 운영비용도 높았다.
연구팀은 이를 해결하기 위해 벡터 유사도 검색과 그래프 탐색, 관계형 필터링을 하나의 질의 안에서 동시에 수행하는 ‘옴니RAG’를 개발했다.
문서의 의미 정보와 개체 간 연결 관계, 표 형태 데이터의 구조적 조건을 함께 활용해 AI가 보다 정확한 근거를 찾을 수 있도록 설계했다.
이를 구현한 핵심 기술로 연구팀은 기존 데이터베이스 구조를 근본적으로 바꿔 벡터 저장소와 그래프 저장소, 관계형 저장소를 하나의 데이터베이스 관리 시스템(DBMS) 안에 통합했다.
이를 통해 문서의 의미와 사람·기업·제품 간 관계, 수치와 날짜 정보까지 한 번에 분석해 AI가 필요한 정보를 보다 정확하게 찾아낸다.
특히 연구진은 저장 구조뿐 아니라 질의 처리 엔진과 최적화 기술도 새롭게 설계했다.

시스템은 벡터 검색과 그래프 탐색, 관계형 연산의 예상 비용과 데이터 규모를 동시에 계산해 가장 효율적인 실행 계획을 자동으로 생성한다.
이를 통해 불필요한 중간 데이터 생성과 이동을 줄이고 LLM이 처리해야 하는 토큰 수도 최소화했다.
실험 결과 기존 시스템에서 최대 21.3초가 걸리던 복합 검색 질의를 1초 이내에 처리해 최대 20배 이상의 속도 향상을 기록했다.
또 옴니RAG를 적용한 AI는 기존 RAG 대비 답변 정확도가 최대 78% 향상됐다.
이번 성과가 AI 기술 경쟁의 핵심이 거대 언어모델 자체에서 데이터 인프라로 이동하고 있음을 보여준다.
지금까지는 더 큰 모델을 만드는 데 초점이 맞춰졌다면 앞으로는 AI가 어떤 데이터를 얼마나 정확하게 찾고 연결할 수 있는지가 성능을 결정할 전망이다.
이번 연구에 참여한 그래파이는 금융·제조·국방 분야 기업을 대상으로 아카식DB 기반 AI 에이전트 서비스를 제공하고, 기업 내부에 분산된 문서와 데이터, 지식 그래프를 통합 관리하는 핵심 플랫폼으로 활용하고 있다.
김 교수는 “기업 데이터는 문서와 관계 정보, 정형 데이터가 복잡하게 얽혀 있기 때문에 AI가 이를 정확하게 이해하려면 통합 데이터 인프라가 필수"라며 ”아카식DB는 AI 에이전트 시대를 위한 차세대 데이터베이스 기술로 국방·제조·금융·법률·과학기술 등 높은 신뢰성이 요구되는 분야의 핵심 인프라가 될 것"이라고 말했다.
한편, 이번 연구는 지난 2월 국제학술대회 ‘ACM SIGMOD 2026’ 데모 논문으로 발표됐다.
(논문명 : AkasicDB: Demonstrating Omni RAG with a Unified Vector-Graph-Relational DBMS / 저자: 이건호 (KAIST, 제1 저자), 박정호, 한동형 ((주)그래파이, 공동 저자) 김민수 교수 (KAIST, 교신저자))

이재형 기자 jh@kukinews.com













































