참고 : 테디노트, LangChain밋업 발표자료[ RAG 프로세스 ]과 으로 나눌 수있다. 에서는 4가지 파트로 나눌 수 있다.(실제 LLM 서비스를 만들 때 사전에 처리하는 작업이기 때문)문서 로드(document loader),다양한 형태의 문서를 로드 →스플릿 : 긴 문서의 경우 LLM이 한번에 입력을 받을 수 없기 때문에 문서를 작은 조각으로 나누게 된다. 이 작업을 ‘청킹 작업’ 이라고 한다. →이제 벡터 DB 공간에 저장하기 위해서 임베딩 과정 수행 → 벡터 DB에 저장 (실시간으로 유저가 질문을 하고 실시간 처리를 수행)유저의 입력 →입력 문장 임베딩 처리 →Retrieve 검색을 통해 원하는 문서의 내용을 가져옴 →프롬프트를 통해 LLM에 전달해서 원하는 답변을 출력 → Answer...