1. What I Learned...
이번주는 NLP 도메인의 Level 1 기초 대회가 마무리되었다. STS(semantic Textual Similarity)라는 Task의 NLP 도메인 대회를 ai.stages에서 Kaggle과 Dacon과 유사한 플랫폼에서 진행했는데, public 전체 2위 private 전체 1위를 달성하였다. 대회를 진행하며 팀장으로 Github관리 및 Notion 관리를 하고 데이터에 대한 EDA를 진행하고 end-to-end로 Hugging Face 모델을 이용해서 학습하고 튜닝을 진행했다. 그리고 팀에서 내가 한 EDA를 바탕으로 데이터 증강을 진행했는데, 해당 증강으로 성능에 유의미한 향상에 기여한 것 같아 의미가 있는 대회였다. 2주간 많은 노력을 했고, 협업이나 모델링 측면에서 많은 발전을 한 것 같고, 또한 어떤 부분을 메꿔나가야할지 깨달은 것 같아 의미있는 한주였다.
2. Study Evaluation
이번 주차에서는 대회 hard 스킬 관점에서 그리고 소통의 관점에서도 기술하려고 한다.
+)잘했던것, 좋았던 것, 계속할 것😊😄
- 대회 Hard 스킬 부분 :
- EDA에 기반한 데이터 증강모델을 만들 때 Label 5에 대한 copied dataset을 만들 때 데이터 분포를 따르도록 아이디어를 내어 데이터셋을 만드는데 기여하였다.
- 하이퍼 파라미터 튜닝방식을 찾고 해당 부분을 적용하여 기존의 모델에서 더 좋은 튜닝 결과를 얻을 수 있었다.
- Loss를 변경할 수 있는 custom_loss방식을 Trainer 클래스에 적용하여 다른 loss값을 실험해보았다.
- 소통 & 협업 부분 :
- 팀원들에게 지속적으로 해야할 부분과 일정들을 체크하여 알려주어 팀장으로서 팀원들이 대회를 차질없이 진행할 수 있도록 노력했다.
- 모든 팀원이 각자 아이디어를 구현할 수 있도록 독려하였고, 해당 팀원이 모델링에서 좋은 결과를 가져왔다.
(-) 잘못했던 것, 아쉬운 것, 부족한 것 -> 개선방향 😢😤
- 대회 Hard 스킬 부분 :
- 실험을 하고 인사이트를 적어 둔 부분이 있는데, 해당 부분을 실험 도중에 기록을 했기 때문에 완벽하게 정리가 안된 부분이 있다. 주말이나 남는 시간을 이용해서 해당 부분을 다시 보고 활용할 수 있도록 해야겠다.
- 모델에 대한 부분이 부족한채 실험을 진행했다. 다음에 실험을 진행할 때에는 모델에 대한 이해도를 더 가지고 진행해야겠다.
- 소통 & 협업 부분 :
- 이야기를 할 때, 내 이야기할 부분이 앞서서 상대방의 말을 명확하게 이해가 안된 상황에서 이야기하는 경우가 더러 있었다. 해당 부분을 보완하기 위해 다시 한번 상대방의 의견을 듣고 이야기해보자.
- 아이디어를 이야기하거나 의견을 이야기할 때 명료하게 설명을 못한 부분이 있다. 장황하게 설명하거나 핵심 내용을 길게 말한 것 같다. 조금더 압축적으로 간단하게 전달할 수 있도록 노력해야겠다.
(!) 도전할 것, 시도할 것🏹🏋️
- 학습 부분 : 대회에 시도한 실험 기록하기 + 1일 1 커밋하기
- 소통 부분 : 짧고 명료하게 아이디어를 전달하기
(-) 키워드(공부한 것, 알게 된 것, 느낀 점)📖🙇🏻♂️
- 소통 부분 : 의견이 명확하게 안 전달 되었을때 위축되는 경향이 있었는데, 상대방이 이해가 되지 않더라도 더 상세하게 정확하게 설명하려고 하는 시도가 늘었고, 해당 시도가 의사소통을 더 원활하게 했다.
- 학업 부분 : 근거가 있는 시도도 실패할 수 있다.
'NaverBoostCamp AI-Tech 5기 > 주간 학습회고' 카테고리의 다른 글
[NaverBoostCamp] 4월 9주차 학습회고 (0) | 2023.05.04 |
---|---|
[NaverBoostCamp] 4월 8주차 학습회고 (0) | 2023.04.28 |
[NaverBoostCamp] 4월 6주차 학습회고 (0) | 2023.04.14 |
[NaverBoostCamp] 4월 5주차 학습회고 (0) | 2023.04.07 |
[NaverBoostCamp] 3월 4주차 주간 학습회고 (0) | 2023.03.31 |