'분류 전체보기' 카테고리의 글 목록 (4 Page)

Introduction

개인 프로젝트 A 2023. 8. 15. 17:35

부트캠프 종료 8월 2일부로 NAVER AI TECH 부트캠프가 종료되었다. 당장에 회사에 지원할 마음이 없었기 때문에 1주일 정도 휴식을 취했다. 자유시간이 생기면 하겠다고 벼르고 있었던 일들을 했다. 산도 타고 바다도 보면서 앞으로 무엇을 해야 할지 고민했다. 가장 먼저 생각해야 했던 것은 "나는 왜 AI 공부를 시작했는가?"였다. 사람들이 겪는 마음속 어려움을 마주한 뒤로 심리학을 공부했다. 내 성향으로 인해 직접 사람들을 치료하기가 어렵다는 것을 깨달은 뒤에는 더 좋은 기술을 통해 사람들을 돕고자 했다. AI 기술을 통해 더 나은 세상을 만들고 싶다. 한편, 나는 그리스도인이다. 나는 그리스도와 교회에 대해 더 알고 싶다. 이를 위해 성경을 읽지만, 많은 경우 성경 안에 내재된 더 깊은 뜻을 이해..

Phrase Retrieval Learns Passage Retrieval, Too

NAVER AI TECH 2023. 7. 5. 02:42

이전 논문(Learning Dense Representations of Phrases at Scale)에서는 dense phrase model이 산출한 결과값이 곧 question에 대한 정답이었다. 즉 비교대상이 retrieval model & reader model이었다. (이전 블로그 글 참조) 하지만 dense phrase model은 retriever model로서도 기능할 수 있다. maximmum score of phrases within the passage를 해당 passage의 점수로 사용하면 된다. 이전 논문에서 사용한 모델 그대로 retriever 모델로써의 성능을 평가해보았더니 아래와 같은 결과가 나왔다. 기존 DPR 모델을 상회하는 성능을 보여주는 것을 알 수 있다. 어떻게 이런..

Learning Dense Representations of Phrases at Scale

NAVER AI TECH 2023. 7. 4. 23:27

Overview Phrase Retrieval $E_s$는 phrase encoder이고 $E_q$는 question encoder이다. MIPS(Maximum Inner Product Search)를 통해 question에 맞는 phrase를 추출해내고자 한다. Base Architecture pre-trained language model을 이용하여 모든 passage tokens(word tokens)의 representation을 얻는다. 각 passage의 representation은 start token과 end token을 결합한 형태가 된다. 모든 phrases가 아닌 모든 words만 indexing, storing 하면 된다는 장점이 있다. 또다른 pre-trained language ..

BERT

NAVER AI TECH 2023. 6. 29. 03:18

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 개요 BERT에서 한 가지 알파벳을 뽑으라면 BERT의 'B'를 뽑겠다. 기존 모델에서는 단방향적 접근(unidirectional approach)만 가능했으나 BERT는 양방향적 접근(bidirectional approach)을 통해 SOTA를 달성하였다. 그렇다면 어떻게 양방향적 접근이 가능했을까? MLM(Masked Languange Modeling)이라는 방법을 발견했기에 가능했다. 지금부터 BERT에 대해 알아보자. 서론 먼저 사전학습(pre-training)을 위해서는 두 가지 접근 방식이 존재한다. 1. feature-based approach Th..

ABOUT ME

동산 동산

티스토리툴바