Super Kawaii Cute Cat Kaoani
728x90
SMALL

전체 글 121

[paper] LLaRA : Large Language Recommendation Assistant (SIGIR 2024)

해당 논문에서 LLM은 Llama2-7B를 사용하였음.  1. Hybrid Prompt Design 2. Curriculum Prompt Tuning    -> 학습의 전반부에는 쉬운 데이터, 학습이 거듭됨에 따라 어려운 데이터를 활용하는 학습 전략 - 전반부 : text only prompt 활용, LLM을 워밍업시키며, sequential recommendation에 대한 기본 패턴을 알려주는 단계 - 후반부 : hybrid prompt 활용, behavior knowledge를 LLM에 주입시키는 단계

NLP/paper 2024.08.09

RAG 프로세스 개념 정리

참고 : 테디노트, LangChain밋업 발표자료[ RAG 프로세스 ]과 으로 나눌 수있다. 에서는 4가지 파트로 나눌 수 있다.(실제 LLM 서비스를 만들 때 사전에 처리하는 작업이기 때문)문서 로드(document loader),다양한 형태의 문서를 로드 →스플릿 : 긴 문서의 경우 LLM이 한번에 입력을 받을 수 없기 때문에 문서를 작은 조각으로 나누게 된다. 이 작업을 ‘청킹 작업’ 이라고 한다. →이제 벡터 DB 공간에 저장하기 위해서 임베딩 과정 수행 → 벡터 DB에 저장   (실시간으로 유저가 질문을 하고 실시간 처리를 수행)유저의 입력 →입력 문장 임베딩 처리 →Retrieve 검색을 통해 원하는 문서의 내용을 가져옴 →프롬프트를 통해 LLM에 전달해서 원하는 답변을 출력 → Answer...

NLP/RAG 2024.07.12

[LLM] 테스트케이스 작성

모델은 7B부터 13B 사이 크기만 사용!최신 LLM들의 특징들을 기록할 예정이다. [EEVE-instruct] (=Solar)- 한국어 모델 중 가장 뛰어난 성능을 보임 [Qwen2-7B]- 한국어 파인튜닝된 모델을 사용. - 기본 질의에도 제대로 답을 못함- 종종 중국어가 섞여서 출력됨. 맘에 안듬 [Ko-PlatYi-6B]- 한국어 파인튜닝된 모델- 사이즈가 작아서 성능이 잘 안나오는 겅향이 있음  [Lamma3-8B]- 굉장히 좋은 듯- 답변에 자신이 없으면 이모티콘을 같이 내뱉는 편- 무료! [Mistral]- 낫벧 [GPT4o]- 조흥ㅁ- 근데 이제 비싸다 [Claude 3.5 Sonnet]하이쿠(가장 작음) -> 소네트(중간) -> 오푸스(가장 큼)- 우와 왜이렇게 빨라 - 문장 질도 좋다...

NLP/LLM 2024.07.02

[concept] Retrieval-Augmented Generation (RAG)

(아 뭐야 알고보니 해봤던거였음 Langchain은 RAG 시스템을 구축하기 위해 사용하는 툴이다..!) LLM에 학습 과정에 포함되지 않은 지식을 주입하는 방법은 크게 2가지. 1. Fine-Tuning : 새로운 지식에 관한 텍스트 데이터 소스를 이용해서 LLM의 파라미터를 파인튜닝한다.2. RAG : 새로운 지식에 관한 텍스트 데이터를 임베딩해서 vector stores에 저장하고, 프롬프트 구성을 진행할 때 외부 데이터로부터 가져온 텍스트 데이터를 함께 이용해여 프롬프트를 구성한뒤 LLM으로부터 답변을 얻어낸다. 즉, 외부 텍스트데이터와 LLM에 주어진 질문을 결합해서 질문에 대한 답변을 생성해내는 방법론이다.   RAG는 기본적으로 외부의 정보를 참조하여 작동하는 구조이므로 인터넷 연결이 필요하..

NLP/RAG 2024.02.28

2.8 그래프 (Graph, Dijkstra)

그래프 (Graph) 그래프의 정의 그래프(G)는 정점(vertex)들의 집합 $V$와 이들을 연결하는 간선(edge)들의 집합 $E$로 구성된 자료구조입니다. 위와 같은 그래프가 있다고 할 때, 정점은 A, B, C, D, E, F 입니다. 또 정점들을 연결하는 간선들은 A-B, B-C, B-E, C-D, E-D, E-F, E-D 입니다. 즉, 위의 그래프는 정점들의 집합 $V = \lbrace A,B,C,D,E,F \rbrace$와 이들을 연결하는 간선들의 집합 $E=\lbrace (A,B),(B,C),(B,E),(C,D), (E,D), (E,F) ,(E,D) \rbrace$로 이루어져 있습니다. 그래프의 활용 그래프는 이렇듯 연결 관계를 표현하기에 현실 세계의 사물이나 추상적인 개념들을 잘 표현할 ..

2.7 힙 (Heap - Priority queue)

프리뷰 (Preview) 우리가 전에 배운 queue는 First-in First-Out(FIFO) 구조였습니다. 즉, 아래와 같은 queue가 있을 때, popleft를 하면 5→3→9→...→6 순으로 요소들이 나올 것입니다. 하지만 이때 들어온 순서에 상관없이, 일정한 기준(우선순위)에 따라 요소들이 나오도록 할 수 있는데, 이를 일반적인 queue와 구분 지어, priority queue라고 합니다. 그런데 원소를 추가할 때마다, 오름차순 혹은 내림차순으로 알아서 정렬해 주는 자료구조인 heap을 통해 priority queue를 구현할 수 있습니다. 힙 (Heap) 코딩 테스트에서는 힙(heap)을 일일이 구현할 필요가 없으며, 이미 잘 만들어진 heap을 잘 활용하는 것이 중요합니다. 그렇기에..

2.6 트리 (Tree)

트리(Tree) Tree는 서로 연결된 Node의 계층형 자료구조로써, root와 부모-자식 관계의 subtree로 구성되어 있습니다. 리스트가 단순히 순서를 매겨 데이터를 나열하는 선형 자료구조라면, 트리는 비선형적인 자료구조입니다.⁽¹⁾ 트리는 root에서 시작하여 여러 개의 tree가 중첩되는 형태로 만들어집니다. 그렇기에 하나의 tree안에 여러 개의 subtree가 존재합니다. Tree 관련 개념 기본적인 트리 관련 용어를 정리해 보도록 하겠습니다. 정점 (Vertex): A,B,C와 같은 값을 갖고 나타내며, 노드로 표현됩니다. 간선 (Edge): 정점 간에 연결된 선입니다. 자식 노드 (Child), 부모 노드 (Parent) 형제 노드(Sibling): 같은 부모를 가진 노드를 말합니다. ..

2.5 이진 탐색 (Binary Search)

탐색 알고리즘(Search Algorithm) 탐색 알고리즘(Search Algorithm)이란 주어진 데이터 안에서 원하는 값을 찾는 알고리즘을 말합니다. 간단한 예시를 들자면, 만약 다음과 같이 나열된 숫자가 주어졌습니다. [2, 93, -2, 0, 84, 2039] 이 상황에서 어떻게 0을 찾을 것인지에 대한 방법론을 만드는 것이 저희의 목표이고, 그러한 방법을 모두 일컬어 탐색 알고리즘이라고 부릅니다. 종류로는 선형 탐색(Linear Search), 이진 탐색(Binary Search), DFS 또는 BFS가 해당하는 비선형 탐색(Non-linear Search)이 있습니다. 그중 이번에 살펴볼 탐색 알고리즘은 코딩 테스트에서 자주 사용되는 이진 탐색입니다. 이진 탐색(Binary Search) ..

728x90
반응형
LIST