호돌찌의 AI 연구소
728x90
article thumbnail
[강의후기] 머신러닝 서비스 구축을 위한 실전 MLOps
후기/강의 2022. 3. 13. 23:10

강의를 여러 개 들은 것들이 많아서 앞으로 종종 강의를 듣고 생각나는 것 + 정보 공유 차원으로 공유하고자 합니다. 아마 패스트캠퍼스 강의 중심으로 작성될 것 같습니다.(신청한 강의가 꽤 많기 때문에..) 0. 강의 https://fastcampus.co.kr/data_online_mlops 머신러닝 서비스 구축을 위한 실전 MLOps 올인원 패키지 Online. | 패스트캠퍼스 현직 MLOps 엔지니어에게 MLOps 서비스화 전과정을 배워보세요! 구축부터 배포, 운영 방법까지 모두 알려드립니다. 대표 클라우드 플랫폼별 실습까지 해보면 내 현업에 적용하는 것은 시간 문제! fastcampus.co.kr 커리큘럼은 여기 를 참고하세요 1. 강의 신청 이유 3년 가까이 ML관련 컨설팅 프로젝트하면서 불편하고..

article thumbnail
Dacon 자연어 기반 기후기술분류 AI 경진대회 후기 _ 기술 Part (2)
후기/공모전 후기 2021. 9. 23. 19:42

이전 글에 이어서 후기를 이어나가겠습니다. 이전 글은 데이터 모양새와 대회 개요에 대한 내용이었다면, 이번 글은 문제를 푸는 방식에 대해 서술합니다. 6. 문제를 푼 방식 6-1. 전처리 및 결측 처리 - 결측은 공백을 채우거나, 전부 다 채워져 있는 '과제명' 열을 채우거나 했습니다. ML 쪽과 PLM 쪽은 조금씩 다르지만 대체적으로 전처리는 숫자들은 대체하고, 영문은 소문자로 대체, 특수문자와 띄어쓰기 등은 공백으로 처리하는 수준이었습니다. 기술적인 문제를 다 풀고 한계점을 찍었을 때 10에 9는 데이터 문제였던 경험이 있는데, 여기 단계가 성능을 엎을 만한 제일 중요한 단계였을 수 있습니다. 상위권이 쓰는 방법은 거의다 비슷하기 때문에, 과거에도 이런 부분을 조정을 했을 때 등수가 막 치고 올라가면..

article thumbnail
Dacon 자연어 기반 기후기술분류 AI 경진대회 후기 _ 기술 Part (1)
후기/공모전 후기 2021. 9. 17. 19:36

대회 결과는 이전 글을 참고하시길 바랍니다. https://hotorch.tistory.com/59 1. 대회 간단 소개 및 도메인 간단히 이야기하면 국가 연구개발과제를 '기후기술분류체계'에 맞추어 예측하는 모델을 개발하는 것입니다. 즉, 방대한 R&D 문헌들 중 기후 기술 연구 내용을 분류하는 것입니다. 저도 처음 들었을 때 기술 문서 분류면 쉬울 것 같다고 생각했지만, 살펴보니 기후 기술들을 더 자세히 분류하는 데이터였습니다. 그리고 정말 처음 보는 내용이 많았고 기후 기술이 상당히 광범위함을 알았습니다. 2. 데이터 간단 소개 - Multiple Text 보통 다들 NLP를 공부 시작하게 되면 IMDB, NSMC와 같은 single text인 경우에 대해서만 다루었습니다. 조금 더 발전하면 sing..

article thumbnail
Dacon 자연어 기반 기후기술분류 AI 경진대회 후기 (상위 3%)
후기/공모전 후기 2021. 9. 8. 21:11

개인적으로 올해 목표 한 10개 정도 세웠었는데, 9월인데 절반밖에 달성을 못했습니다. 올해 목표 여러 개 중 하나가 올해 데이터 관련 대회에서 나름 유의미한 성적을 내는 것이 목표였습니다. 작년에 운 좋게 1등을 한 경험이 있었지만 제가 다른 일을 벌인 게 많아 혼자 하거나 열심히 하지 않았습니다. 마침 7월 말에 시간이 조금 생긴 것도 있고, 좀 흥미로워 보이는 대회가 마침 열려서 참가하였습니다. 좋은 사람들과 팀을 구성해서 상금은 못 받았지만 총 258팀들 중에서 7등(상위 3%)을 달성하였습니다. 후기를 작성하는 데 있어 기술적인 부분을 제외한 후기를 이야기해보고자 합니다. 1. 팀원 구성 배경 학부생 때는 학교 친구들은 너무 친해서 같이 대회 나가보면 대회 등수가 조금만 횡보하면 포기를 해버리는..