부트캠프 종료
8월 2일부로 NAVER AI TECH 부트캠프가 종료되었다. 당장에 회사에 지원할 마음이 없었기 때문에 1주일 정도 휴식을 취했다. 자유시간이 생기면 하겠다고 벼르고 있었던 일들을 했다. 산도 타고 바다도 보면서 앞으로 무엇을 해야 할지 고민했다. 가장 먼저 생각해야 했던 것은 "나는 왜 AI 공부를 시작했는가?"였다. 사람들이 겪는 마음속 어려움을 마주한 뒤로 심리학을 공부했다. 내 성향으로 인해 직접 사람들을 치료하기가 어렵다는 것을 깨달은 뒤에는 더 좋은 기술을 통해 사람들을 돕고자 했다. AI 기술을 통해 더 나은 세상을 만들고 싶다. 한편, 나는 그리스도인이다. 나는 그리스도와 교회에 대해 더 알고 싶다. 이를 위해 성경을 읽지만, 많은 경우 성경 안에 내재된 더 깊은 뜻을 이해하지 못한다. 따라서 다른 영적 서적을 참고해서 성경을 읽게 되는데, 때로는 "질문"에 대한 답을 영적 서적에서 "추출"하고 싶다고 생각했다. 다른 많은 성도도 나와 같은 심정일 것이다. 데이터베이스에서 맥락을 검색하고, 맥락에서 정답을 찾는 모델(Retriever and Reader Model)을 만들어보자.
Closed-Domain Question Answering
내가 하려는 과제는 closed-domain question answering이라고 할 수 있다. 이에 대해 자세히 설명한 사이트가 있어서 참고할 수 있었다.
데이터베이스로는 내가 즐겨 읽는 성경 해설책인 Life-Study of the Bible을 사용하기로 했다. 다음은 Life-Study of the Bible의 저작권을 소유하고 있는 Living Stream Ministry의 Copyright Policy이다.
주요 사항은 다음과 같다.
- No website may publish a majority (more than 50%) of any complete work. A complete work is defined as any complete published entity. For example, any whole tract, booklet, chapter of a book, book, hymn, article, etc. would be considered a complete published entity.
- Quoted LSM material may not constitute a majority of any page's content (i.e., more than 50% of any one web page).
- Any quotation taken from LSM publications should be given a proper citation, including the author's name, the title of the work, the title of the source, the publisher, the place and date of publication, and the exact page number(s) or URL from which the quotation was taken. We realize that this can be a laborious task, but it is in keeping with the long-established norms for attributing quoted material to its proper source.
