베이스 아카이브

유튜브 알고리즘? 내 취향을 어떻게 아는건데? 본문

IT/지식정보

유튜브 알고리즘? 내 취향을 어떻게 아는건데?

반키 2022. 1. 9. 11:50

안녕하세요!

오늘은 유튜브 알고리즘이

어떤 식으로 사용자들에게 추천하는지에 대해 알아보겠습니다!


유튜브 피드에서 보이는 추천 영상들

 

내 관심사들 사이에 왜 이런 영상을 추천해 주는 건지

알 수 없는 영상들이 간혹 눈에 띄곤 합니다.

 

많은 사용자들이 이런 현상을 겪고 있어

국내에선 '알 수 없는 유튜브 알고리즘'이라는

인터넷 유행어가 활성화되기도 했습니다.

 

이번 포스팅에서는

유튜브의 추천이 진짜 알 수 없는 것인지, 아닌지에 대해 알아보도록 하겠습니다.

 

유튜브 알고리즘

 

유튜브의 최고 제품 책임자 CPO 닐 모한(Neal Mohan)은

2019년 3월 뉴욕타임스와의 인터뷰에서

유튜브 이용자들의 시청 시간 70%가 추천 알고리즘에 의한 결과이며

알고리즘을 통해 총 비디오 시청 시간이 '20배 이상 증가했다'라고 하는데요,

2010년 초반 유튜브 피드에 뜨는 추천 영상은 '조회수' 데이터 중심이었습니다.

 

조회수가 높으면 높을수록 인기가 있고

많이 찾는 영상이라 생각되어 노출이 되고는 했습니다.

이런 조회수 중심의 추천이 계속되자 문제가 발생되기 시작했습니다.

바로 '낚시'가 시작된 것이죠.

 

영상 내용과는 아무런 관련이 없으나

사람들의 호기심을 끌어 자극적인 제목과 썸네일이 피드에 넘쳐나기 시작했습니다.

이런 상황들이 계속 이어지며

유튜브에는 가짜 뉴스와 정확하지 않은 정보들이 많아지기 시작했습니다.

 

그러자 유저들은 "클릭해도 어차피 내가 원하는 내용은 없음", "유튜브에는 낚시 영상만 많음" 등의

유튜브를 신뢰하지 못하는 반응들이 나타났습니다.

 

상황의 심각성을 인지한 유튜브는

2012년 조회수가 아닌 다른 알고리즘으로 변경한 후

지금까지 꾸준히 추천 알고리즘을 변화시켜오고 있습니다.

 

 

Q. 유튜브 추천 알고리즘 원리가 무엇이죠?

우선 유튜브 측이 알고리즘에 대해 지금까지 정확히 밝힌 적은 없지만

관련하여 구글에서 발표한 관련 논문을 통해

추천할 영상 목록을 만드는 알고리즘

그 목록에서 추천 우선 순위를 정하는 알고리즘

이렇게 2단계로 구성되어 있다는 정도는 알려져 있습니다.

 

외부에서도 유튜브 알고리즘을 밝히기 위해 활발히 연구 중인데,

연구기관에서 공통적으로 밝히는 유튜브 추천 알고리즘의 목적은

결국 이용자들의 만족도를 높이고 유튜브에 오래 체류시키는 것이라고 합니다.

따라서 개인 시청 기록 데이터, 영상의 내용, 조회수, 조회수 증가속도, 시청 지속 시간, 좋아요/싫어요/댓글/공유, 

사용자 참여 정도, 참신성, 채널 내 영상 업로드 빈도, 세션 시간, 지역 등

다양한 요인을 기반으로 추천 알고리즘을 구성하여 유튜브 이용자들의 만족도를 높이고

유튜브에 오래 체류시키도록 만드는 것으로 알려져 있습니다.

 

추천 알고리즘이란

쉽게 말해서 사용자가 어떤 콘텐츠를 선호하는지 분석하여

'이런 영상이라면 볼 것 같다'하는 콘텐츠를 추천해주는 것을 말합니다.

 

이런 추천 알고리즘은 유튜브뿐만 아니라

넷플릭스와 같은 OTT 서비스, 멜론과 같은 음악 스트리밍 서비스 등

다양한 서비스에서 개인 맞춤형 콘텐츠를 제공하기 위해 사용됩니다.


알고리즘이 추천할 콘텐츠를 선택하는 방법

크게 '협업 필터링''콘텐츠 기반 필터링' 두 가지로 나누어집니다.

먼저 취향이 비슷한 이용자들을 활용한 '협업 필터링'에 대해서 알아보겠습니다.

 

협업 필터링이란,

이용자들로부터 얻은 데이터를 기반으로 선호를 예측하는 방법입니다.

협업 필터링은 크게 이용자 기반 추천아이템 기반 추천으로 나뉩니다.

 

아이템 기반 추천이란

과거에 시청했던 것과 연관성이 높은 다른 영상을 추천하는 방식입니다.

예를 들어, 이용자가 수학 기초 관련 영상을 시청한 이력이 있다면 

유사한 수학 심화 강의 등 관련 수학 강의를 추천해주는 방식을 말합니다.

 

협업 필터링은 이용자 개개인의 데이터를 활용해 추천하는 방식으로

다수가 원하는 영상보다는 개인의 취향을 정밀하게 파악해서

관심 가질 만한 상품을 추천할 수 있다는 장점이 있습니다.

 

개인 맞춤 알고리즘인 만큼 영상 시청을 선택할 확률이 높고

이용자가 많아질수록 데이터가 쌓여 추천 정확도와 신뢰도 또한 올라갑니다.

 

그러나 데이터에 대한 의존도가 높아 생기는 문제점도 있습니다.

이용자의 정보나 영상 시청 기록에 대한 데이터가 없는 경우

처음 이용하는 사용자이거나 새로 나온 영상은 추천이 어렵습니다.

또한 이용자가 많아질수록 데이터양이 많아져서 계산이 오래 걸려 효율성이 떨어진다는 단점이 있습니다.


다음으로 콘텐츠 유사성으로 추천하는 '콘텐츠 기반 필터링'에 대해 알아보겠습니다.

협업 필터링의 단점을 보완해주는 것이 바로 '콘텐츠 기반 필터링' 기법입니다.

콘텐츠 기반 필터링이란

말 그대로 이용자가 소비한 콘텐츠를 기준으로 유사한 특성을 가진 콘텐츠를 추천하는 방식을 말합니다.

 

예를들어 이용자가 선호하는 영상 콘텐츠를 분석해보니

'마블(Marvel)'이라는 공통점이 나왔고

마블 영화의 특성을 추출해보니

'히어로물, 스칼렛 요한슨(Scarlett Johansson) 출연, 장르: 액션'이라는 분석이 나왔습니다.

그러면 콘텐츠 기반 필터링에 의해 이용자에게는 다른 히어로물인

'캡틴 마블(Captain Marvel), '블랙 팬서(Black panther)' 등을 추천할 수 있습니다.

또한 스칼렛 요한슨이 출연한 다른 영화 '루시', '레이디스 나잇', '그녀' 등도 추천할 수 있습니다.

 

따라서 계산이 오래 걸리고 새로운 상품에 대한 추천이 어려운 협업 필터링의 단점을

콘텐츠 기반 필터링으로 해결할 수 있게 되었습니다.

 

하지만 비슷한 특성의 상품을 계속해서 추천하기 때문에 추천되는 아이템의 다양성이 떨어진다는 단점이 존재합니다.

또한 콘텐츠의 특성만을 추출하다보니 이용자 개인의 취향을 정밀하게 파악할 수 없다는 문제점도 있습니다.


앞서 말씀드린 두 가지 방식의 한계 때문에 최근에는 새로운 방식의 추천 시스템이 개발되고 있습니다.

그중에서 각광받는 아래 두 가지 최신 알고리즘을 소개해 드리고자 합니다.

첫 번째로 하이브리드 추천 시스템(Hybride Recommender System)입니다.

하이브리드 추천 시스템은

협업 필터링과 콘텐츠 기반 필터링을 조합하여 상호 보완적으로 개발된 알고리즘입니다.

협업 필터링의 *콜드 스타트 문제 해결을 위해 신규 콘텐츠는 콘텐츠 기반 필터링 기술로 분석하여 추천하고

(*콜드 스타트 문제 : 신생 기업이 겪는 어려움의 하나로,

고객의 수가 적어서 고객 맞춤 상품이나 서비스 개발에 활용할 고객 데이터가 부족한 문제)

 

충분한 데이터가 쌓인 후부터는 협업 필터링으로 추천의 정확성을 높이는 방식입니다.

 

두 번째로 머신러닝 추천 시스템(Machine Learning Recommender Systems)입니다.

머신러닝의 학습으로 추천하는 방식도 많이 개발되고 있는데

이용자에게 추천할 후보군을 먼저 보여주고 기계가 그에 대한 이용자의 반응을 학습하며

점점 더 정교한 결과를 도출해내는 방식입니다.

 

 

이렇게 다양한 추천 시스템에 대해서 알아보았는데요,

유튜브는 추천 시스템의 도입으로 총 비디오 시청 시간을 20배 이상 증가시켰고

넷플릭스 자체 평가로는 매출의 75%가 추천 시스템에 의해 발생한다고 합니다.

 

추천이 수익이 되는 시대라고 해도 과언이 아닌 만큼

많은 개발자들과 연구원들로부터 더욱 발전된 방법들이 개발될 것이라고 기대됩니다.

 

 

지금까지 설명드린 유튜브 알고리즘 시스템에 대해 가벼운 이해가 되셨나요?!

이 포스팅이 도움이 되셨길 바라고

오늘은 여기서 마무리하겠습니다!

 

감사합니다.


https://base-archive.tistory.com/entry/인공지능머신러닝딥러닝의-차이점

 

인공지능, 머신러닝, 딥러닝의 차이점이 뭐지?

안녕하세요! 오늘은 인공지능, 머신러닝, 딥러닝 이 세가지 차이점에 대해 알아보겠습니다! 애플의 인공지능 비서 시리, 테슬라의 자율주행기술 오토파일럿, 틱톡의 안면인식 필터, 이 서비스의

base-archive.tistory.com

Comments