[진로탐색] ML/DL 분야 스스로 다녀본 중소기업(스타트업) 탐방후기 4탄
안녕하세요~!
27년차 진로탐색꾼 조녁입니다!!
진짜 조만간 28년차가 되네요!! 26년차일 때 27년차로 바뀐게 엊그제 같은데 어느덧 28년차라니!!!!!
이번에 4탄으로는 3탄에서 감사하게 2차 면접을 보게 된 곳과 이전에 지원했던 회사들의 1차 면접들을 정리하였습니다!
지난번 3탄 때는 오프라인이 3개였어서 기억을 더듬으며 정리했는데, 이번엔 화상 면접이 많았어서 조금씩 기록하면서 면접에 참여할 수 있었습니다. (덕분에 조금 더 선명하게 기록할 수 있었습니다!)
12월 초중반에 다녔던 진로 탐색 3탄은 아래 링크에서 확인해보실 수 있습니다!
2021.12.14 - [진로 탐색 log] - [진로탐색] ML/DL 분야 스스로 다녀본 중소기업(스타트업) 탐방후기 3탄
개인적인 면접 경험을 기록하는 이유는,
제 부족함을 복기하면서 더 발전하고자하는 것과 혹시 누군가에게 도움이 되실까 해서 입니다!
면접 다녀온 곳 : 인터파크(1,2차), 홀썸브랜드
면접 후기
1. 인터파크_NLP 챗봇 모델러 : 팀장님께서 팀 소개와 질의응답을 해주시고, 모델러 현업자와 1대1 기술면접을 진행함. (총 22분 걸린게 킬포.)
- 후기 : 매번 면접은 현업자와 진행하고 싶다고 생각했는데 이번에 그랬다. 팀장님께서 첫인사만 하시고 바로 현업자와 1대1 기술면접을 진행했다. 확실히 질문도 날카로웠고, 답변하는데도 긴장이 됐었다. 다만 아직 면접관 경험은 많으시지 않으신 지 질문에 대한 꼬리질문도 없었고 질문량 자체가 많지는 않았다. 그래서 질의응답까지 22분밖에 안걸리고 끝나버렸다. 참 신기한 경험이었다.
- 내가 한 질문
- 현재 팀에서 코드리뷰를 진행하고 계신가요?
- BE와 DL 개발자가 함께 있어, DL에 대한 코드리뷰는 안하고 있으나, 앞으로 할 계획에 있음
- 데이터는 어떤 데이터를 활용하고 있나요?
- 톡집사 구현에는 쇼핑,투어,도서의 구매데이터를 활용하고 있으며, 원할 시 요청하면 전사 데이터 활용 가능함.
- 팀은 어떻게 구성되어 있나요?
- TO까지 9명 구성이다. 하지만 매각 후 내년에는 더 확장될 수 있다.
- 현재 톡집사는 프롬프트 러닝을 적용하였나요?
- 톡집사는 룰베이스 기반으로 기존에 생성한 문장을 출력하고 있다.즉, 생성 모델 사용안하고 있다.
- 입사하는 신입개발자에게 추천하는 공부가 있으신가요?
- 최신 NLP 모델, 프롬포트 러닝, MLOps(BentoML , Airflow ,MLflow) 와 같은 툴들의 선택 이유와 목적이해하기, 실서비스 올렸을 때 발생한 오류에 대한 대처법 찾아보기
- 받았던 기술면접 질문 정리
- 프롬프트 러닝에 대해 아는만큼 설명하시오.
- 톡집사는 오픈도메인일까요 클로즈드도메인일까요?
- 클로즈드 도메인임.
- 챗봇(톡집사)가 잘못된 답변을 뱉었을 때 어떻게 대처하실 건가요?
- 우선 개발할 때 최대한 안전하게 설계할 것이다. 예를 들어, 판단하기 애매한 것은 모른다고 답변하도록 설계하는 것이다. 이유는 챗봇이 모른다고 답변할때 사용자의 답답함보다, 잘못답변해서 일이 꼬이게 될때의 리스크가 훨씬 크기 때문이다. 또한, 챗봇을 구현할 때, 애매한 답변에 대해선 직접 상담원과 연결할 수 있는 버튼을 둘 것이다.
- 면접 후에, 이 질문에 대해 여쭤봤을 때 실서비스 시 발생한 오류에 대한 대처법을 찾아볼 것을 권하셨다.
- 트랜스포머 모델과 바트 모델의 차이점을 설명해주세요. (난 아직도 질문이 아리송하다..)
- 바트 모델의 경우 NSP 대신 SOP로 난이도를 높여 더 잘학습하도록 함. 또한 MLM을 여러가지 방식으로 적용함.
- 셀프어텐션과 바다나우 어텐션의 차이를 설명하시오.
- 우선 바다나우 어텐션에는 RNN구조가 남아있지만, 셀프어텐션에는 오직 어텐션만 존재한다.
- 바다나우 어텐션의 경우, 오차역전파할 때 어텐션을 통해 역전파가 되서 그레디언트 디센트 문제를 어느정도 해결할 수 있지만, 아직까지도 매우 느리고 병목이 발생한다.
- 인코더의 셀프어텐션과 디코더의 셀프어텐션 차이를 설명하시오.
- W2V의 네거티브 샘플링이 더 빠른 이유에 대해 설명하시오. (softmax 시 연산량 줄어드는 것까지 설명 원했다고 하심)
- 다중분류 문제를 이진분류(네거티브와 파지티브) 문제로 바꿔주기 때문이다.
2. 홀썸브랜드_데이터 사이언티스트 : CTO님과 1대1 화상 커피챗 , 말그대로 면접보단 서로를 알아가는 시간이라 재밌었다.
- 후기 : CTO님 소개를 들었을 때, AWS에서 일하신 이력이 되게 신기했다. 실력과 커리어를 겸비하신 분이구나 싶었고, 팀을 소개하실 때도 회사를 발굴하는 것과 성장시키는 것을 데이터 기반으로 한다는 것이 흥미로웠다. 그래서 이 팀에 있으면 다양한 분야에 대한 인사이트와 개발 실력까지 많이 성장할 수 있겠구나 싶었다. 하지만 내가 조금 더 높은 연차가 되서 도전하고싶은 영역이라고 느껴졌다. 왜냐하면 정말 소수로 이뤄져있고, NLP보단 시계열 데이터나 테블로 데이터를 더 중점적으로 다룰 것 같았기 때문이다.
- 내가 한 질문
- 10억 규모의 회사를 어떻게 수치로만 판단할 수 있을까요? 회사 내부 분위기가 다르거나, 수치를 거짓으로 주는 경우는 어떻게 찾을 수 있을까요?
- 미팅타겟이 정해지면 비즈니스 담당자들이 실사를 많이 한다. 뿐만 아니라 뒷광고와 같은 불법행위를 판단하는 자체 기준들이 있다. 예를 들어 매출이 급등락 한다던 지와 같은 기준이 있다.
- 뿐만 아니라, 가짜 리뷰 디텍션, 특정 군집에서 브랜드 검색이 몰려있다던 지 여러 가지 기준으로 잡아낼 수 있다.
- 하지만 자동화로 대량의 회사를 판단하는 일은 큰 숙제이다. 이미 어느정도 하고있지만 더 잘해야하는 부분이다.
- 가장 재밌게 하셨던 프로젝트는 어떤게 있으신가요?
- 16년 야후에서 리서치 인턴할 때 했던 프로젝트가 기억에 난다. 뉴스 타이틀에 대해 클릭하는 사람들 패턴을 파악해서 토픽 모델링 변형모델로 컨텐츠에서 가장 CTR이 높을 것같은 헤드라인을 만들어 주는 것이었다.
- AWS에서 홀썸브랜드로 이직하실 때 컬처핏이 잘 맞았다고 하셨는데 어떤게 있었을까요?
- 미국에서 한국 바이어와 일할때 늘 숨이 막혔다. 그러나 지금 사장님은 그런 부분이 없이 투명하고 솔직했다. 무엇보다 테크팀 고유한 문화를 만들어 보고 싶었다.
- 2차 면접때는 어떤 것들을 하게 되나요?
- 하나의 상황을 주고 구두로 주고받으며 문제해결하는 과정을 그려볼 것이다. 추가로, 했던 프로젝트에 대해 End to End 설명하는 과정을 해볼 것이다.
- CTO님 및 회사 소개
- CTO님 소개 : 학부는 미국, 대학원은 카이스트(자연어처리)에서 박사까지 했다. 이후 시애틀 알렉사 팀에서 근무 (추천,유저 프로파일링)하며 고객 요청에 대해 예측하고 액션의 보기를 주는 업무를 했다. PM과 2-3명이서 프로토타이핑해서 제품화 하는 방식으로일했었다. 이후에는 AWS 한국 머신러닝 솔루션랩으로 왔고, 업무는 요청이 들어오면 프로토타입을 만들어주는 역할이었다. 그리고 6개월전에 지금 대표님 만나게 되었는데 컬처핏, 비즈니스 아이템이 잘맞아서 오게되었다.
- 회사 소개 : 한국 커머스는 세계 4위다. 커머스 시장에서 10억정도 규모의 회사를 발굴 및 인수해서 성장시킬 수 있도록하는 중계 플랫폼을 만드는게 목표다. 비슷한 비즈니스 모델이 2-3년전부터 미국에서 잘되고 있다.
- 머신러닝 & 데사팀 역할은 첫번째로 통계 기반으로 좋은 회사를 발굴 하는것이다. 두번째로, 성장시키기 위해 마케팅 브랜딩을 어떻게 할 수있을 지 데이터 기반해서 솔루션 찾는 것이다.
3. 인터파크_NLP 챗봇 모델러(2차) : 부서장님, 인사팀장님, 개발실장님과 1대3 화상면접을 진행함. 1차와 마찬가지로 25분컷.
- 후기 : 인성질문뿐 아니라, 기술적인 질문도 하셨었다. 그리고 프로젝트도 확인성 질문이 들어왔었다. 다만, 1차때와 마찬가지로 면접시간이 너무 짧아서(25분 내외) 이게 잘본건 지 못본 건지 감이 안온다. 솔직하게 말하면 지금 면접본 지 꽤 지난 상태에서 적어서 크게 기억이 안난다. 그만큼 무난한 면접이었다. 아! 한가지 기억에 남는 건 무슨 말을 해도 앞에분들 반응이 별로 없으셨다 ㅎㅎ..