본문 바로가기

[wavve] 웨이브톡

[웨이브톡] 이용자 취향 저격수, 데이터응용개발팀 왕성현 연구원

 

종종 마주치는데도 속으론 ‘누구지?’ 합니다. 사람도 많아졌고, 재택근무도 잦다보니 얼굴 볼 기회도 없습니다. 잘 모르고, 잘 안보여도 함께하는 많은 동료가 있습니다. 서로의 생각을 공유하고, 좀 더 이해하면서 협업하면 좋겠다는 바람. '작은 실천’의 의미로 릴레이 인터뷰 코너를 시작합니다. <편집자주>

 

당신이 좋아할 만한 OO

 

국내 최대 OTT 플랫폼 웨이브가 보유하고 있는 콘텐츠는 무려 34만 편 이상. 가끔은 시청할 작품을 고르지 못한 채 방대한 콘텐츠의 바다에 빠져 허우적대는 불상사가 발생하기도 한다. 그럴 때 찾게 되는 “당신이 좋아할 만한 OO” 밴드. 여러 데이터를 분석해 나도 몰랐던 내 콘텐츠 취향을 발굴해주는 고마운 추천 시스템이다. 이 시스템을 개발하는 장본인, 데이터응용개발팀의 왕성현 연구원을 만나보았다.

 

 

Q. 데이터응용개발팀, 데이터를 활용해 서비스를 개발하는 팀인가요?

 

네. 저희 팀에서는 웨이브 내의 모든 데이터를 한곳에 모으는 작업을 시작으로 통합 랭킹, 추천 시스템 등을 개발하고 있습니다. 뿐만 아니라 다양한 데이터를 비개발직군 팀에서도 쉽게 보고 활용할 수 있도록 환경을 구축하는 역할 역시 수행하고 있어요.

 

그중에서도 저는 개인화 추천 시스템 개발을 담당하고 있는데요. 유저들의 시청 시간을 나타내는 ‘북마크 데이터’, 유저들의 활동 기록을 볼 수 있는 ‘로그 데이터’, 콘텐츠에 대한 정보를 담고 있는 ‘메타 데이터’ 등을 활용해 개인에게 관심이 있을 만한 작품들을 선정해주는 알고리즘을 개발하고 있습니다.

 

'그 해 우리는'을 3번 정주행한 연구원의 실제 웨이브 추천작들이다.

 

정보의 홍수 속에서 유저들의 효용을 높이기 위해 대부분의 IT기업은 개인화 추천 시스템을 도입하고 있다. 콘텐츠의 메타 정보를 활용해 비슷한 작품을 추천해주는 ‘콘텐츠기반 필터링’, 나랑 비슷한 작품들을 시청한 다른 유저들의 기록을 바탕으로 한 ‘협업 필터링’. 현재 웨이브에서는 이 두 가지 시스템의 장점을 결합한 ‘하이브리드 필터링’으로 콘텐츠를 추천하고 있다.

 

“당신이 좋아할 만한 OO” 밴드가 바로 그 주인공이다.

 

 

Q. "당신이 좋아할 만한 OO" 밴드에 대해 설명 부탁드립니다!

 

영화, 드라마, 해외시리즈 등 각 장르별로 시청자의 데이터를 분석해 좋아할 것으로 추정되는 작품을 모아둔 밴드입니다. 비슷한 취향의 다른 유저들이 시청한 콘텐츠들을 기반으로 추천작 선정, 그중에서도 내가 최근에 본 작품과 동일한 배우가 출연했다거나 비슷한 장르의 콘텐츠들에 가중치를 두고 점수를 산정하는 식으로 운영되고 있습니다.

 

이 알고리즘에 의해 상위권의 점수를 얻은 작품 30개가 홈 화면에 밴드로 나타나게 되는데요. 팁을 드리자면 한 작품을 많이 시청하는 것보다 짧게라도 다양한 작품들을 시청하면 정확도가 올라가 더 정교한 추천이 가능하답니다.

 

 

Q. 더 정교한 추천 시스템이라는 판단은 어떻게 이루어지나요?

 

‘AB 테스트’가 가장 직관적인 방법인데요. “당신이 좋아하는 추천 밴드”의 알고리즘 성능이 실제로 향상되었는지 알기 위해서 유저들의 반응을 확인하는 겁니다. 랜덤으로 유저들을 분류해서 기존 추천 밴드와 바뀐 추천 밴드를 각각 서비스해보는 거예요. 개선한 알고리즘으로 밴드를 제공했을 때 유저들이 추천된 콘텐츠를 더 많이 클릭하고, 시청했는지 비교하는 거죠.

 

또한 추천 알고리즘을 실제 서비스에서 테스트하는 건 안정성 이슈에 대한 부담이 있다 보니, 내부적으로 유저의 과거 시청 데이터를 이용해 추천 콘텐츠 중 얼마나 실제 시청으로 이어졌는지, 유저에게 추천된 콘텐츠가 다양한지 등의 지표를 비교해 평가하고 AB 테스트 진행 여부를 판단하고 있습니다.

 

 

Q. 코드가 잘 실행되는 걸 넘어 끊임없이 발전이 필요한 분야네요. 이런 부분에서 어려운 점이 있으실까요?

 

먼저, 데이터 분석에 대해 공부하다 보면 “Garbage in Garbage out”이라는 말을 종종 듣게 되는데요. 좋지 않은 데이터를 이용하면 좋지 않은 결과를 얻게 된다는 뜻입니다. 현재 웨이브에서 많은 데이터가 생성, 적재되고 있는데 더 좋은 정보를 추출하기 위해 어떻게 처리하면 좋을지에 대한 고민이 있어요.

 

그리고 요새 다양한 추천 알고리즘들이 연구되고 있는데, 그 속도가 너무 빠르다 보니 기술 트렌드를 따라가기 위해 개인적으로 스터디에 참여하고 있습니다. 다른 회사에서 추천 서비스를 개발하시는 현업자나 이 분야를 열심히 연구하고 계신 대학생, 대학원생 분들과 함께 관련 논문과 타사 자료들을 보고 이야기를 나누면서 개발에 도움이 될 만한 정보를 꾸준히 공부하는 중이에요.

 

 

Q. 업무 외에도 스터디까지 진행 중이시라니... 정말 본투비 개발자이시네요!🤗

 

사실 대학원 진학 전, 제 전공은 요리였습니다. 대회도 나가고 메뉴 개발도 해봤었는데 점점 다른 친구들에 비해 요리에 대한 흥미가 부족하다고 느꼈어요. 그때 데이터 분야가 비전이 있겠다는 생각으로 코딩을 배웠는데 적성에 맞더라고요. 다른 사람들보다 이해도 빠른 것 같고, 오류가 생겼을 때 원인을 찾아가는 게 재밌었다고 할까요? 그래서 대학원에서 통계학과 함께 머신러닝, 딥러닝 등을 공부해 이 자리까지 오게 되었습니다.

 

 

특이한 이력을 가진 그는 데이터 분야의 전문가가 되겠다는 일념으로 졸업 후에도 꾸준히 추천 시스템 개발 분야에서 일해왔다. 곡 추천 시스템을 개발했던 전 직장을 거쳐 웨이브에 합류한 지 1년이 된 그. 그가 느낀 웨이브의 첫인상은 ‘위트 있는 단체’였다.

 

 

Q. 웨이브 입사하실 때 기억에 남는 일이 있으시다고요?

 

웨이브 입사 전 대표님과 2차 면접 당시 제가 가벼운 농담으로 ‘아이유가 웨이브의 모델이라서 관심이 생겼다’고 말씀드렸는데 면접이 마무리될 즈음 대표님께서 아이유 브로마이드를 선물로 주시더라고요. 참 ‘위트있는 단체구나’라고 생각했어요.

 

최근에 진행되었던 ‘테크 서핑 데이’ 행사도 딱딱하게 진행될 수 있을 법 했는데 실제 해변가에 온 듯한 컨셉으로 웨이브만의 젊고, 위트 있는 문화가 돋보였던 것 같아요. 아쉽게도 꽃무늬 남방 셔츠 배송이 생각보다 오래 걸려서... 따로 드레스 코드 준비는 못 했지만요.

 

 

Q. 웨이브의 자유로운 문화가 개발자들에게 도움이 되나요?

 

고착화된 기술에 안주하기 보다는 새로운 기술들을 자유롭게 시도할 수 있다는 부분에서 굉장히 만족해요. 이러한 시도들이 저희의 업무 환경을 향상시켜 주기도 하거든요.

 

또, 저희 팀은 MBTI가 모두 I로 시작하는데 성향이 비슷해서 마음을 잘 터놓고 말하는 편입니다. 일에 있어서도 수평적이고 서로를 존중하다 보니 작은 의견도 자유롭게 나누면서 업무를 진행하고 있습니다.

 

 

Q. 그럼 마지막으로 이런 팀에서 함께 하길 원하는 주니어 개발자들에게 한마디 부탁드립니다!😁

 

개발자라고 해서 코딩만 하지는 않더라고요. 회사는 많은 사람과 함께 일하는 공간이기 때문에 서로 업무 리스트와 진행 상황 그리고 개발하면서 문제를 해결했던 과정들을 함께 공유할 수 있도록 정리를 잘하시는 분이면 좋을 것 같아요.

 

결정적으로 저는 자기가 하는 일에 대해 성장하고자 하는 욕심이 있는 분이면 좋겠어요. 틈틈이 새로운 기술이나 다른 곳에선 어떻게 기술을 이용했는지 등에 관심 가지고 공부하면서 웨이브에서 부족한 점은 보완하고, 강한 점은 부각하는, 함께 욕심을 실현시키고자 하는 분이면 좋을 것 같습니다.

 

 

잔병치레가 잦아 팀 내에서 ‘왕연약’이라는 별명을 갖게 됐다던 왕성현 연구원. 웨이브에서 도전해보고 싶은 일을 묻는 말에 그는 다음 서핑데이 때 발표자로 참여하고 싶다며 수줍게 의사를 밝혔다. 2022년, 솟아나는 호랑이 기운을 받아 ‘왕연약’ 이미지를 벗고 ‘제N회 서핑 데이’에서 그를 만날 날을 고대해본다.

 

‣ 웨이브일보 노진아 기자 wlsdk3000@wavve.com

 

🍀MBTI는 I지만 여행은 좋아하는 성현 연구원의 사진첩🍀
📌인천 동화마을에서 한 컷 바다보면서 커피 한잔의 여유☕

🌸'그 해 우리는' 느낌의 연구원 원픽 사진 (in 인천 차이나타운)