NLP 3

[NaverBoostCamp] 4월 7주차 학습회고

1. What I Learned... 이번주는 NLP 도메인의 Level 1 기초 대회가 마무리되었다. STS(semantic Textual Similarity)라는 Task의 NLP 도메인 대회를 ai.stages에서 Kaggle과 Dacon과 유사한 플랫폼에서 진행했는데, public 전체 2위 private 전체 1위를 달성하였다. 대회를 진행하며 팀장으로 Github관리 및 Notion 관리를 하고 데이터에 대한 EDA를 진행하고 end-to-end로 Hugging Face 모델을 이용해서 학습하고 튜닝을 진행했다. 그리고 팀에서 내가 한 EDA를 바탕으로 데이터 증강을 진행했는데, 해당 증강으로 성능에 유의미한 향상에 기여한 것 같아 의미가 있는 대회였다. 2주간 많은 노력을 했고, 협업이나 모..

[NaverBoostCamp] 4월 5주차 학습회고

1. What I Learned... 이번주는 도메인 관련 NLP 강의를 듣는 두번째 주였다. 이번주 강의에서는 Seq2seq 모델 부터 BERT 모델까지 많은 내용의 모델에 대해 배웠다. sequence to sequence 모델의 기본적인 구조인 Encode, Decoder 구조, 그리고 발전된 seq2seq with Attention 모델까지 공부하였고, 최근에 가장 각광받고 기본이 되는 모델인 Transformer 모델과 Attention module 그리고, multi head Attention의 연산방식까지 학습했다. 이후에는 GPT-1, BERT 등 새롭게 출시된 다양한 모델의 기본적인 컨셉에 대해서 학습을 한 뒤 2주간의 짧지만 긴 커리큘럼이 마무리 됬다. 특히 이번주에는 과제가 어려웠는데..

[NaverBoostCamp] 3월 2주차 주간 학습회고

1. What I Learned... 이번주에는 PyTorch 모듈에 대한 내용을 배웠다. PyTorch 모듈에 대한 배경지식과 Tensorflow에 비교한 장단점 등 모듈의 기본적인 내용 부터, 연산, 템플릿 만드는 방법에 이르기까지 PyTorch 전반적인 내용에 대해서 학습하였다. 특히 광범위한 내용을 다뤘지만 view, reshape의 차이, matmul, mm의 차이 등 자주 사용되지만 미묘하게 쓰임이 다른 내용까지 세심하게 다룰 수 있어서 좋았다. 이외에도 Troubleshooting, transfershooting, Tensorboard 만드는 방법 등 실습에 유용한 내용들을 배웠고, 나중에 실제로 작업을 하게 될 때 많은 도움이 될 것 같다는 생각이 들었다. 그리고 이번 과제에서 custom..