HTML 삽입 미리보기할 수 없는 소스 자연어 처리에는 많은 평가 방법들이 존재하는데, 기계 번역의 성능이 얼마나 뛰어난지를 측정하기 위해 사용되는 대표적인 방법인 BLEU(Bilingual Evaluation Understudy) 대해서 학습해 보겠습니다. 목차 1. Unigram Precision 2. N-gram Precision 3. Modified N-gram Precision 4. Brevity Penalty BLEU score BLEU는 기계번역과 사람이 직접 번역한 결과가 얼마나 유사한지 비교하여 번역에 대한 성능을 측정하는 방법입니다. (번역에 있어서는 PPL 보다는 BLEU가 좀 더 신뢰성이 있다고 합니다.) BLEU은 언어에 구애받지 않고 사용할 수 있으며, 계산 속도가 빠르다는 장점..
네이버 부스트캠프 3주차 회고 1. DL Basic & Data Viz 3주차에는 Deep Learning Basic, Data Visualization(1/2) 강의를 수강하였습니다. 이론을 공부한 후, 코드를 보며 다시 이해를 해보는 과정을 여러번 반복하며 공부했던 것 같습니다. transformer와 Generative 모델 강의는 정말 여러 번 봐도 어려웠던.. 추가 학습 자료를 정말 많이 찾아봤던 부분이였습니다. 그에 비하여 data visualization 강의는 조금은 편하게 들을 수 있었습니다. 2. 과제 수행 기본 과제는 코드 빈칸을 채우는 형식이였는데 사실 앞의 실습 강의를 열심히 들었으면 충분히 채울 수 있는(사실 그냥 채울 수 있음) 과제였습니다. 최대한 이를 이해하고 채워보려고 노..
네이버 부스트캠프 2주차 회고 1. Pytorch 2주차에는 pytorch 프레임워크에 대한 강의를 들었습니다.(사실 강의보다 과제가 메인이였던것 같음) 강의는 파이토치의 전반적인 부분을 다루었고(활용보다는 프레임워크 구조 이해 등등) 과제로 파이토치 다큐먼트를 보면서 활용해봤습니다. 다큐먼트를 읽고 활용하는 것이 중요하다는 이야기를 많이 들었는데 다큐먼트의 진입장벽..(저에겐 꽤 높았습니다) 으로 인해 구글링과 책을 더 많이 활용하고 있었는데 이번 기회에 부덕이 덕분에 다큐먼트를 열심히 읽고 친해질 수 있어서 정말 좋은 한 주 였습니다. 2. 과제 수행 기본과제1, 2가 있었는데 강의 수가 적은 이유가 과제 때문이더라고요.. 특히 기본과제 1은 정말 오래 걸렸던 것 같습니다. 어려워서 오래걸렸다 보다는..
네이버 부스트캠프 1주차 회고 1. Python & AI Math 1주차에는 'Python & AI Math'라는 타이틀의 강의를 수강하였다. 파이썬을 다시 훑어보고, 넘파이, 판다스 복습하고 AI에 필요한 수학을 맛보는 느낌의 강의여서 처음에는 큰 부담을 가지지 않았는데, 막상 수강해 보니 엄청난 강의량이...나에게 부담을 주었다..(화요일 수요일은 아침 8시부터 강의를 들었던 것 같다,. 코어타임이 10시부터 7시라서 좋아했는데 그럴 필요가 없었다는...) 파이썬은 몇 번을 공부해도... 배울 때마다 부족한 부분이 많이 보인다.. 사실 하나씩 정리하면서 공부하고 싶지만 운영진 분들은 날 그렇게 놔두지 않는다... (대충 들어야 할 강의가 엄청 많다는 의미..) 그래도 하나씩 천천히 공부하고 정리하려한..