NaverBoostCamp AI-Tech 5기/주간 학습회고

[NaverBoostCamp] 4월 7주차 학습회고

uomnf97 2023. 4. 21. 20:32

AI-Tech 5기

1. What I Learned...

이번주는 NLP 도메인의 Level 1 기초 대회가 마무리되었다. STS(semantic Textual Similarity)라는 Task의 NLP 도메인 대회를 ai.stages에서 Kaggle과 Dacon과 유사한 플랫폼에서 진행했는데, public 전체 2위 private 전체 1위를 달성하였다. 대회를 진행하며 팀장으로 Github관리 및 Notion 관리를 하고 데이터에 대한 EDA를 진행하고 end-to-end로 Hugging Face 모델을 이용해서 학습하고 튜닝을 진행했다. 그리고 팀에서 내가 한 EDA를 바탕으로 데이터 증강을 진행했는데, 해당 증강으로 성능에 유의미한 향상에 기여한 것 같아 의미가 있는 대회였다. 2주간 많은 노력을 했고, 협업이나 모델링 측면에서 많은 발전을 한 것 같고, 또한 어떤 부분을 메꿔나가야할지 깨달은 것 같아 의미있는 한주였다. 

 

2. Study Evaluation

이번 주차에서는 대회 hard 스킬 관점에서 그리고 소통의 관점에서도 기술하려고 한다.

+)잘했던것, 좋았던 것, 계속할 것😊😄

  • 대회 Hard 스킬 부분 :
    • EDA에 기반한 데이터 증강모델을 만들 때 Label 5에 대한 copied dataset을 만들 때 데이터 분포를 따르도록 아이디어를 내어 데이터셋을 만드는데 기여하였다. 
    • 하이퍼 파라미터 튜닝방식을 찾고 해당 부분을 적용하여 기존의 모델에서 더 좋은 튜닝 결과를 얻을 수 있었다. 
    • Loss를 변경할 수 있는 custom_loss방식을 Trainer 클래스에 적용하여 다른 loss값을 실험해보았다.
  • 소통 & 협업 부분 :
    • 팀원들에게 지속적으로 해야할 부분과 일정들을 체크하여 알려주어 팀장으로서 팀원들이 대회를 차질없이 진행할 수 있도록 노력했다. 
    • 모든 팀원이 각자 아이디어를 구현할 수 있도록 독려하였고, 해당 팀원이 모델링에서 좋은 결과를 가져왔다.

(-) 잘못했던 것, 아쉬운 것, 부족한 것 -> 개선방향 😢😤

  • 대회 Hard 스킬 부분 :
    • 실험을 하고 인사이트를 적어 둔 부분이 있는데, 해당 부분을 실험 도중에 기록을 했기 때문에 완벽하게 정리가 안된 부분이 있다. 주말이나 남는 시간을 이용해서 해당 부분을 다시 보고 활용할 수 있도록 해야겠다. 
    • 모델에 대한 부분이 부족한채 실험을 진행했다. 다음에 실험을 진행할 때에는 모델에 대한 이해도를 더 가지고 진행해야겠다. 
  • 소통 & 협업 부분 :
    • 이야기를 할 때, 내 이야기할 부분이 앞서서 상대방의 말을 명확하게 이해가 안된 상황에서 이야기하는 경우가 더러 있었다. 해당 부분을 보완하기 위해 다시 한번 상대방의 의견을 듣고 이야기해보자.
    • 아이디어를 이야기하거나 의견을 이야기할 때 명료하게 설명을 못한 부분이 있다. 장황하게 설명하거나 핵심 내용을 길게 말한 것 같다. 조금더 압축적으로 간단하게 전달할 수 있도록 노력해야겠다.

(!) 도전할 것, 시도할 것🏹🏋️

  • 학습 부분 : 대회에 시도한 실험 기록하기 +  1일 1 커밋하기
  • 소통 부분 : 짧고 명료하게 아이디어를 전달하기 

(-) 키워드(공부한 것, 알게 된 것, 느낀 점)📖🙇🏻‍♂️

  • 소통 부분 : 의견이 명확하게 안 전달 되었을때 위축되는 경향이 있었는데, 상대방이 이해가 되지 않더라도 더 상세하게 정확하게 설명하려고 하는 시도가 늘었고, 해당 시도가 의사소통을 더 원활하게 했다.
  • 학업 부분 : 근거가 있는 시도도 실패할 수 있다.