티스토리챌린지 2

1st Grand Gathering: Sudo Pseudo Explore 후기

👨🏻‍💻 안녕하세요! 제이덥입니다. 오늘은 "가짜연구소"의 첫번째 Grand Gathering 행사를 갔다온 후기와 얻었던 인사이트에 대해서 포스팅합니다. 가짜연구소는 어떤기관이고, 행사는 어떤 부분에 초점이 맞춰져있는지, 행사를 통해 어떤 것들을 얻을 수 있을지 자세히 서술해드리려고 합니다.  1️⃣ 가짜연구소란?가짜연구소는 머신러닝/데이터사이언스 분야에 관심있는 사람들이 함게 성장하는 공동체를 이루고자 2020년 결성된 비영리 커뮤니티입니다. 김찬란님과 안성진님이 함께 창립했으며, 운영진과 빌더(프로젝트 or 스터디 운영자)를 주축으로 하여 "공유, 동기부여, 함께하는 즐거움"이라는 비전 아래에 오픈소스, 공모전 활동, 리서치, 스터디 등 다양한 활동을 활발히 진행하고 있습니다.  가짜연구소 홈..

Conference 2024.11.24

[NLP] Bags of Words & Naive Bayes Classifier for Document Classification

안녕하세요! 제이덥입니다. 최근에 기술 면접을 준비하며, 기초적인 내용부터 하나씩 정리하고 있는데요. 오늘은 텍스트 마이닝에서 사용하는 방법들 2가지를 정리해봤습니다. 첫 번째는 텍스트를 숫자로 표현하는 기법인 Bag Of Words(BoW) 표현형과 이를 활용한 Naive Bayes Classifier에 대해 정리해봤습니다.  1️⃣ Bag of Words (BoW)자연어를 다루는 분야를 NLP(Natural Language Processing; 자연어처리), Text Mining(텍스트 마이닝), Information Retrieval(정보 검색)으로 나눌 수 있는데요. Bag of Words는 딥러닝 기술이 적용되기 이전 텍스트 마이닝에서 자주 사용되던 기법입니다. Bag of Words는 단어들의..

NLP 2024.11.10