Super Kawaii Cute Cat Kaoani
728x90
SMALL

NLP/RAG 12

RAG 프로세스 개념 정리

참고 : 테디노트, LangChain밋업 발표자료[ RAG 프로세스 ]과 으로 나눌 수있다. 에서는 4가지 파트로 나눌 수 있다.(실제 LLM 서비스를 만들 때 사전에 처리하는 작업이기 때문)문서 로드(document loader),다양한 형태의 문서를 로드 →스플릿 : 긴 문서의 경우 LLM이 한번에 입력을 받을 수 없기 때문에 문서를 작은 조각으로 나누게 된다. 이 작업을 ‘청킹 작업’ 이라고 한다. →이제 벡터 DB 공간에 저장하기 위해서 임베딩 과정 수행 → 벡터 DB에 저장   (실시간으로 유저가 질문을 하고 실시간 처리를 수행)유저의 입력 →입력 문장 임베딩 처리 →Retrieve 검색을 통해 원하는 문서의 내용을 가져옴 →프롬프트를 통해 LLM에 전달해서 원하는 답변을 출력 → Answer...

NLP/RAG 2024.07.12

[concept] Retrieval-Augmented Generation (RAG)

(아 뭐야 알고보니 해봤던거였음 Langchain은 RAG 시스템을 구축하기 위해 사용하는 툴이다..!) LLM에 학습 과정에 포함되지 않은 지식을 주입하는 방법은 크게 2가지. 1. Fine-Tuning : 새로운 지식에 관한 텍스트 데이터 소스를 이용해서 LLM의 파라미터를 파인튜닝한다.2. RAG : 새로운 지식에 관한 텍스트 데이터를 임베딩해서 vector stores에 저장하고, 프롬프트 구성을 진행할 때 외부 데이터로부터 가져온 텍스트 데이터를 함께 이용해여 프롬프트를 구성한뒤 LLM으로부터 답변을 얻어낸다. 즉, 외부 텍스트데이터와 LLM에 주어진 질문을 결합해서 질문에 대한 답변을 생성해내는 방법론이다.   RAG는 기본적으로 외부의 정보를 참조하여 작동하는 구조이므로 인터넷 연결이 필요하..

NLP/RAG 2024.02.28
728x90
반응형
LIST