AI 13

Efficient Methods for Natural Language Processing: A Survey 요약

Abstract Recent work in natural language processing (NLP) has yielded appealing results from scaling model parameters and training data. (그런데 여기서, performance를 향상시키기 위해 using only scale하는 것은 resource consumption또한 증가하는 것을 의미한다.) This survey synthesizes and relates current methods and findings in efficient NLP. We aim to provide both guidance for conducting NLP under limited resources, and point ..

AI/논문 리뷰 2023.08.18

부스트코스 '딥러닝을 이용한 자연어 처리' 강좌

딥러닝을 이용한 자연어 처리 부스트코스 무료 강의 www.boostcourse.org 1. Introduction 교수자: 조경현 교수 New York University Courant Institute (Computer Science) and Center for Data Science Facebook AI Research 2. Basic ML: 지도학습 알고리즘: 어떤 문제를 푸는데 있어서 필요한 일련의 명령들 머신러닝: data-driven algorithm design 지도 학습에서 결정해야할 일 [Provided] 1. N 개의 Input 과 Output 으로 구성된 훈련 샘플(Training Examples) D={(x​1​​,y​1​​),⋯,(x​N​​,y​N​​)} 2. Loss Functi..

AI 2023.07.10

연세대학교 대학원 인공지능학과 합격!

기분 좋은 소식이 생겼다. 그것은 바로 2023년 후기로 연세대학교 일반대학원 인공지능학과에 합격했다는 소식..!사실 이전에는 그전에 인턴했던 대학교에 미련이 남아서 재도전할까 싶었는데, 어차피 나는 석사후 취업을 원하는 입장이고 약 2달간의 공백기를 맛보니까 하루빨리 어느곳에 소속되어서 커리어를 쌓아가는게 더 좋지 않을까 싶었다. 물론 그 학교는 다시 재도전할만한 가치가 있는 학교이긴 했지만 지금 붙은 학교도 충분히 좋은 학교라고 생각해서, 이곳에 입학해서 열심히 공부한뒤에 2년뒤에 사회로 나올것이다.ㅎㅎ 처음에 대학원을 준비하려면 먼저 입시설명회를 보면서 그 학교의 대략적인 분위기를 파악하는게 중요하다고 생각한다. 어떤식으로 입시를 준비해야되는지 감을 잡을 수 있게된다. 이후에 모집시기를 잘 파악하고..

AI 2023.06.17

딥러닝 기술면접 준비 2

Q1. 지도학습, 비지도학습, 강화학습 정의 및 종류? 지도학습: Classification와 Regression으로 나뉨. * Classification- kNN(데이터로부터 거리가 가까운 k개의 다른 데이터의 레이블을 참조하여 분류하는 알고리즘이며, 데이터간 거리를 측정할때 '유클리디안 거리' 계산법을 사용), Naive Bayes, Support Vector(결정 경계(Decision Boundary), 즉 분류를 위한 기준 선을 정의하는 모델이다. 그래서 분류되지 않은 새로운 점이 나타나면 경계의 어느 쪽에 속하는지 확인해서 분류 과제를 수행할 수 있게 된다. 최적의 결정 경계는 마진을 최대화한다.), Machine Decision * Regression- Linear Regression(모든 데..

AI 2023.05.31

딥러닝 기술면접 준비 1

Q1. 딥러닝과 머신러닝의 차이는? 기존 머신러닝에서는 학습하려는 데이터의 여러 특징 중에서 어떤 특징을 추출할지 사람이 직접 분석하고 판단해야하는 반면, 딥러닝에서는 기계가 자동으로 학습하려는 데이터에서 특징을 추출하여 학습하게 된다. 따라서 특징 추출에 사람이 개입(feature engineering)하면 머신러닝, 개입하지 않으면 딥러닝이다. 또한, 딥러닝은 머신러닝보다 큰 데이터셋과 긴 학습시간이 필요하다. 정형데이터는 주로 머신러닝, 비정형데이터는 주로 딥러닝 방식을 사용한다. +) 머신러닝이란 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법이다. 머신러닝은 조건이 복잡하고 규칙이 다양한 경우에, 데이터를 기반으로 일정한/숨겨진 패턴을 찾아내서 문제를 해결한다. 머신러닝의 단점은..

AI 2023.05.29