[NIE] 알고리즘의 명암
1. 주제 다가서기 소셜 미디어에 접속할 때 내 계정의 첫 화면 콘텐츠와 다른 사람의 화면 구성은 왜 다를까? 이는 바로 우리가 무엇을 좋아하는지 분석하는 알고리즘이 작동하기 때문이다. 알고리즘이란 본래 ‘어떤 문제를 해결하기 위한 절차, 방법, 명령어들의 집합’이라는 뜻이다. 하지만 미디어 환경에서 알고리즘은 인공지능(AI)이 이용자의 인적사항, 관심사, 콘텐츠 선호 성향 등 광범위한 정보를 분석해 이용자에게 맞춤형 콘텐츠를 제공하는 체계를 뜻하는 말로 쓰인다. 알고리즘 기술은 일상생활 속에서 다양한 방식으로 적용되고 있다. 알고리즘은 우리가 관심 있어 할 만한 상품을 온라인 쇼핑몰에서 추천해주기도 하고, 현재 아이템과 유사한 아이템을 찾아 정보를 제공해주며, 포털 사이트에서 검색할 때 도움을 주기도 한다. 이러한 기능은 수많은 정보 속에서 우리의 선택에 도움을 주어 매우 편리하기도 하지만, 필터버블(Filter Bubble)과 에코 체임버(Echo Chamber)를 형성하는 등 우리 사회의 다양성을 제한하는 주요 요인으로 작용하기도 한다. 이번 시간에는 알고리즘이란 무엇인지 이해하고, 알고리즘이 우리 사회에 미치는 영향에 대해 살펴보고자 한다. 2. 주제 관련 신문기사 ‣ 소년한국일보 2023년 4월 26일 알고리즘의 추천, 편리하지만 위험해 ‣ 한국일보 2023년 4월 19일 친절한 AI 추천? 이윤 극대화 위한 체류시간 늘리기 전략일 뿐 ‣ 국민일보 2024년 1월 4일 플랫폼 노동자 옥죄는 알고리즘… 거부하면 접속차단·무배정 3. 신문 읽기 <읽기자료 1> 알고리즘의 추천, 편리하지만 위험해 유튜브나 틱톡에 접속하면 어떤 영상이 뜨나요? 마치 취향을 저격한 것처럼 내가 좋아할 만한 영상이 떠 있을 때가 많지요? 인스타그램에 접속하면 사람마다 화면을 가득 채운 사진들이 다를 것입니다. 동물을 좋아하는 사람에겐 동물 사진이. 음식을 좋아하는 사람에겐 맛있는 음식이나 유명 맛집 사진이 잔뜩 떠 있겠지요. 편리한 개인 맞춤형 알고리즘 이런 서비스들에는 개인 맞춤형 알고리즘이 적용돼 있다. 우리가 입력한 개인정보, 인터넷에 올린 글, 영상을 시청한 기록, ‘좋아요’를 누른 내역. 그리고 우리와 비슷한 취향을 가진 사람들은 어떤 영상이나 글을 주로 보는지 등 여러 정보를 자동으로 분석해서 우리가 무엇을 좋아할지 추천해 주는 방식이다. 알고리즘은 원래 특정한 문제를 해결하기 위한 절차나 공식을 뜻한다. 곧 개인 맞춤형 알고리즘은 ‘사람들 개개인이 좋아할 만한 콘텐츠를 추천하라.’는 목적을 수행하는 공식이라고 할 수 있다. 프로그램 언어를 통해 이런 공식을 적용해 우리가 좋아할 만한 콘텐츠를 자동으로 뽑아 보여 주는 것이다. 요즘 인터넷 서비스들은 대부분 개인 맞춤형 알고리즘을 적용하고 있다. 유튜브나 틱톡 같은 동영상 서비스는 물론이고 페이스북과 인스타그램 같은 SNS, 네이버와 다음 등 포털 사이트, 인터넷 쇼핑몰, 심지어 음악을 들을 수 있는 음원 스트리밍 서비스도 이용자가 좋아할 만한 콘텐츠를 자동으로 추천해준다. 인터넷 서비스에서는 광고도 마찬가지다. 알고리즘을 통해 이용자가 사고 싶어 할 만한 제품을 보여준다. 그런데 만약 개인 맞춤형 알고리즘이 갑자기 사라지면 어떻게 될까? 크게 당황스러울 것이다. 페이스북이나 인스타그램의 수많은 게시 글, 유튜브나 틱톡의 다양한 영상 중에서 내가 좋아할 만한 걸 일일이 찾아야 할 테니 시간이 너무 많이 걸린다. 그만큼 개인 맞춤형 알고리즘이 우리에게 편리함을 주고 있다는 의미이다. 알고리즘이 우리의 감정과 생각까지 조종한다? 그런데 개인 맞춤형 알고리즘은 장점만 있는 게 아니다. 이것 때문에 필터 버블(filter bubble)이 심각해진다는 우려가 있다. 필터 버블이란 ‘필터링’이 되어 편향된 정보만 받아들이다 보니 거품 안에 갇힌 모습을 비유하는 표현이다. 내가 좋아할 만한 정보만 받아들이면 생각이 거기에 갇혀 버리거나, 한쪽으로 편향된 생각이 더 강화될 우려가 있다. 자신이 좋아하는 정보만 받아들이게 되는 모습이 마치 편식하는 것과 비슷하다고 해서, ‘정보 편식 현상’이라고 부르기도 한다. 개인 맞춤형 알고리즘으로 추천받은 글이나 영상만 보는 게 왜 문제라는 걸까? 미국의 신문 《월스트리트 저널》은 동영상 서비스 틱톡의 개인 맞춤형 알고리즘의 문제를 파악하기 위해 실험을 했다. 봇 계정(특정 프로그램이 일정한 목적을 가지고 기계적으로 생성하는 가짜 계정) 100개를 만든 다음 이들 계정에 각자 다른 성격을 부여해서 수십만 개의 영상을 시청하게 한 것이다. 이 실험에서 우울한 감정을 가진 것으로 설계된 한 계정은 처음에 높은 조회수가 나온 영상을 주로 추천받았다. 그러던 중 틱톡은 이 계정이 우울과 관련된 영상을 그냥 넘기지 않고 더 길게 본다는 사실을 발견하자 3분 만에 유사한 영상을 다시 추천했다. 이후 4분 만에 다시 유사한 영상을 추천했다고 한다. 추천이 반복되면서 이 계정이 접속 후 36분 동안 추천받은 영상 278개 중 무려 93%가 우울과 관련되거나 슬픈 내용의 영상이었다. 추천 영상이 늘어날수록 표현의 수위도 높아졌다. 내가 만약 기분이 우울할 때 틱톡을 보게 됐다고 생각해보자. 이럴 때는 기분이 좋아지도록 노력해야 하는데, 알고리즘 세상에 빠져 버리면 오히려 감정이 더 악화할 수 있는 것이다. 특히 SNS에서 뉴스를 볼 때 알고리즘이 가짜 뉴스나 편파적인 뉴스를 많이 보여 줌으로써 사람들의 편향성을 부추긴다는 우려도 있다. 정치적으로 편향된 사람이 자신의 생각과 일치하는 뉴스만 보게 되면, 지지하는 정치 세력의 잘못은 외면하고, 싫어하는 정치 세력의 문제점만 크다고 생각할 것이다. 개인 맞춤형 알고리즘이 우리의 수많은 정보를 모아서 작동한다는 점에서 주목할 필요가 있다. 우리가 인터넷에 남긴 발자취 하나하나를 재료로 삼는 건데, 그렇게 되면 우리의 은밀한 개인 정보를 누군가가 알게 될 수도 있다. (중략) 누구를 위한 개인 맞춤형 알고리즘일까 수많은 인터넷 서비스들은 알고리즘이 우리의 생각을 더 잘 알아낼 수 있도록 하는 기술을 열심히 개발하고 있다. 알고리즘을 적용하는 서비스도 점점 늘어나고 있다. 포털 사이트의 주요 뉴스는 몇 년 전만 해도 사람이 직접 선정했는데, 이제는 그 역할을 알고리즘이 하고 있다. 왜 이렇게 인터넷 서비스들은 하나같이 개인 맞춤형 알고리즘을 적용하고 또 발전시키려 노력하는 걸까? 우리의 편리함을 위해서일까? 이것은 바로 ‘돈’과 관련이 있다. 유튜브의 한 임원은 《뉴욕 타임스》인터뷰를 통해 유튜브 시청 시간 중 70%가 추천 알고리즘에 의한 것이라고 밝힌 적이 있다. 그러니까 우리가 하루에 유튜브를 100분 동안 본다면 그 중 70분은 알고리즘의 추천을 통해 콘텐츠를 봤다는 의미이다. 만약 개인 맞춤형 알고리즘이 존재하지 않았다면 우리는 30분만 유튜브를 봤을 것이다. 그런데 유튜브 첫 화면에서부터 추천 영상이 튀어나오고, 영상을 다 보고 나서도 자동으로 다음 추천 영상이 재생되니 우리도 모르는 사이 유튜브에 빠져들 수밖에 없다. 이렇게 우리를 인터넷 서비스에 오래 머물게 하려는 이유는 무엇일까? 바로 오래 머물러야 더 많은 광고를 볼 것이고, 그래야 인터넷 사업자들이 더 많은 돈을 벌 수 있기 때문이다. 이런 이유로 인터넷 서비스를 운영하는 기업을 ‘콘텐츠 기업’이면서 ‘광고 기업’이라고 규정하기도 한다. 인터넷 서비스의 개인 맞춤형 알고리즘이 우리를 편리하게 해 주는 건 부인할 수 없는 사실이다. 하지만 이로 인한 필터버블 문제나 개인정보 침해 우려가 심각하다는 점을 생각해 봐야 한다. 그리고 무엇보다 인터넷 사업자들이 순전히 우리를 위해서만 개인 맞춤형 알고리즘을 만들고 발전시켜 나가는 건 아니라는 사실에 주목할 필요가 있다. <출처 : 소년한국일보 2023-04-26> <읽기자료 2> 친절한 AI 추천? 이윤 극대화 위한 체류시간 늘리기 전략일 뿐 AI는 사용자의 이용 패턴과 데이터를 분석해 ‘개인 맞춤형’으로 어떤 콘텐츠를 보여줄지 결정한다. 유튜브뿐 아니라, 인스타그램, 페이스북, 네이버·카카오 뉴스 등도 자신들이 개발한 AI추천 알고리즘을 통해 이용자가 무엇을 보고 들을지 결정한다. 이렇게 가면 AI가 우리 머릿속을 지배해 파멸로 몰아갔던 사례가 있다. 2017년 당시 14세 영국 소녀 몰리 러셀은 사회관계망서비스(SNS)가 지속적으로 추천한 자해 및 자살 관련 게시물에 장시간 노출됐다가, 결국 스스로 목숨을 끊었다. 몰리는 숨지기 전 6개월 동안 인스타그램을 하루 최대 120회 사용하며 1만 1,000개 이상의 콘텐츠에 ‘좋아요’를 표시했다. 조사당국은 ”몰리가 이용한 콘테츠 중 일부는 성인이 보기도 어려울 만큼 잔인했다“며 ”SNS 게시물이 죽음에 영향을 미쳤다“고 결론을 내렸다. AI 알고리즘은 어떤 식으로 작동해 14세 몰리를 삶의 벼랑 끝으로까지 밀어냈던 것일까. 추천 알고리즘은 어떤 식으로 작동해 14세 몰리를 삶의 벼랑 끝으로까지 밀어냈던 것일까. 추천 알고리즘이란 개념 자체는 컴퓨터가 존재하기 전부터 있었다. 식당 점원이 평소 어떤 음식이 잘 팔리는지를 주의 깊게 봐뒀다가 ”저희 집은 떡볶이가 잘나가요“라며 알려주는 것 또한 추천 알고리즘이다. AI 추천 알고리즘은 인간의 직관과 기억력에 의지하던 이 과정을 데이터와 알고리즘을 통해 자동화한 것이다. 지금 사용되는 추천 알고리즘은 어떤 데이터를 기준으로 추천하느냐에 따라 크게 △콘텐츠 기반 필터링과 △협업 필터링으로 구분된다. 콘텐츠 기반 필터링은 추천 기준이 콘텐츠다. 이용자가 소비한 콘텐츠의 특성을 기준으로 그 사람의 취향과 선호를 파악해 그에 맞는 콘텐츠를 제공하는 방식이다. 옷가게 점원이 단골 손님에게 ”손님은 통 넓은 흰색 반팔 티셔츠를 자주 구매하셨으니까 분명 이 신상 티셔츠도 마음에 드실 거예요“라며 권하는 식이다. 반면 협업 필터링은 콘텐츠가 아닌 다른 이용자의 데이터를 기준으로 한다. 대상 소비자와 비슷한 성향이나 선호를 가질 것으로 추정되는 이용자를 유사 이용자군으로 상정하고, 그 그룹의 소비 결과를 토대로 목표 소비자에게 콘텐츠를 추천한다. 옷가게에 처음 방문한 이용자에게 점원이 ”고객님처럼 날씬한 분들이 많이 찾으시는 상품이에요“라며 추천하는 것과 비슷한 원리다. 그러나 언뜻 보기에 사용자에게 더없이 친절한 AI 추천 알고리즘은 알고 보면 기업 이윤 극대화에 모든 서비스의 초점이 맞춰져 있다. 어떻게든 이용자의 체류 시간을 늘리고 사이트에 사람들을 잡아두기 위해 물불을 가리지 않는다는 뜻이다. 몰리의 죽음도 따지고 보면 ‘체류시간’이 결정적이었다. 몰리는 알고리즘이 계속 공급하는 유해 콘텐츠에 사로잡혀 SNS를 벗어나지 못했고, 자해·자살 게시물의 홍수에 빠져 극단적 선택을 하게 됐다. (중략) AI가 발전하는 만큼 AI 경계론이 비등해지자, 일부 빅테크들은 자사 알고리즘을 공개하고 투명성을 강화하려는 움직임으로 위기를 벗어나려 한다. 트위터는 이달 자사 콘텐츠 추천 알고리즘에 해당하는 소스 코드를 공개했다. 틱톡도 지난해 12월 영상 추천 방식을 공개했고, 네이버와 카카오 또한 뉴스 알고리즘 검증 위원회를 설치하거나 뉴스 배치 알고리즘을 외부에 알렸다. 알고리즘에 ‘인간성’을 담아 보려는 시도 또한 늘고 있다. IT전문매체 와이어드에 따르면 페이스북 운영사 메타의 심리학자와 개발자 등으로 구성된 연구진은 AI가 추천한 페이스북 게시물의 노출도, 이용시간 등에 따른 이용자 만족도를 측정하는 연구를 진행 중이다. 당장의 이윤을 포기하더라도 알고리즘이 사람을 행복하게 만드는 방향으로 작동하는 방식을 고민하기 시작했다는 의미다. <출처 : 한국일보 2023-04-19> <읽기자료 3> 플랫폼 노동자 옥죄는 알고리즘… 거부하면 접속차단·무배정 기준 알려달라 요구에 “비밀” 거부 최근 몇 년간 플랫폼 노동계의 뜨거운 이슈 중 하나는 ‘알고리즘’이다. 플랫폼 업체들이 일감 배분에 인공지능(AI)을 도입하면서 알고리즘은 노동자의 생계를 좌우하는 수단으로 활용되고 있다. 2년 전 배달라이더·대리운전기사·웹툰 작가 등이 연합한 ‘플랫폼 노동희망찾기’가 출범하며 알고리즘 설명 의무를 주요 요구안에 포함했던 이유다. 2022년 한국노총 중앙연구원이 플랫폼 종사자 600명을 대상으로 실태 조사한 결과 플랫폼 업체들은 알고리즘에 따른 강제 일감 배정으로 노동자를 통제하고 있는 것으로 나타났다. 강제 배정 거부 시 어떤 불이익을 당하는지 실험한 결과 앱 접속을 제한하는 경우가 45.2%였고, 접속하더라도 일감이 배정되지 않은 경우가 63.8%에 달했다. 특히 알고리즘에 의한 강제 배정은 주로 수입 대비 시간이 오래 걸기거나, 대기시간이 긴 일감으로 조사됐다. 강제 배정이 자율 배정보다 노동강도가 높은 과업이라고 볼 수 있는 것이다. 플랫폼 종사자의 82.7%는 일감 배정 원리와 불이익 기준 등에 대한 설명이 필요하다고 응답했다. 반면 관련 설명을 들은 비중은 11.8%에 그쳤다. 라이더 노조인 ‘라이더유니온’의 배달원들은 지난해 우아한청년들(배민커넥트) 등 주요 4개 배달플랫폼에 라이더 업무 행태에 관한 개인정보 수집 내역을 알려 달라고 요청했다. 업체들은 라이더의 위치정보와 배송기록 등을 알고리즘 학습에도 일부 활용하고 있었다. 알고리즘을 활용한 배차 기준을 알려 달라는 요청에 업체들은 공통적으로 ‘영업비밀에 해당한다’거나 ‘개인정보와 무관하다’고 답변했다. 배달 업무 수행실적에 따라 라이더에게 적용되는 고유의 페널티 적용 기준도 공개하지 않았다. 구교현 라이더유니온지부 위원장은 지난달 ‘플랫폼의 비밀 알고리즘과 개인정보 열람 청구권’ 국회 토론회에서 “내게 왜 콜이 안 들어오는지, 왜 자꾸 특정 지역에서만 콜이 뜨는지, 지금 배달료는 왜 3000원도 안 되는지에 대해 라이더는 알 수 있는 방법이 없다“며 ”이런 상황에서 라이더는 자발적으로 플랫폼에 대한 충성도를 높이는 방식으로 적응하고 있다“고 토로하기도 했다. 이런 국내 상황과 달리 해외에서는 플랫폼 노동자는 물론 알고리즘 정보에 대해서도 규제를 강화하는 추세다. 유럽연합(EU)은 지난달 플랫폼 노동자의 근로자성 관련 5개 기준을 제시하고, 2개 이상 충족하면 근로자로 보는 입법 지침에 합의했다. 근로자성 부인 입증 책임은 플랫폼 기업에 있다. 해당 지침에도 노동자의 노동조건에 영향을 미치는 알고리즘 정보를 투명하게 공개하고 설명해야 할 의무가 포함됐다. <출처 : 국민일보 2024-01-04> 4. 생각 열기 ◈ 기본활동 1) <읽기자료 1>을 읽고, ‘개인 맞춤형 알고리즘’에 활용되는 개인정보는 무엇인지 찾아봅시다. - ◈ 기본활동 2) <읽기자료 1>을 읽고, 개인 맞춤형 알고리즘의 장점과 단점을 정리해 봅시다. -장점: -단점: ◈ 기본활동 3) <읽기자료 1>을 읽고, ‘필터 버블’의 뜻을 찾아 써 봅시다. - ◈ 기본활동 4) <읽기자료 1, 2>를 읽고, 인터넷 서비스 운영 기업이 개인 맞춤형 알고리즘을 제공하는 이유는 무엇인지 정리해 봅시다. - ◈ 기본활동 5) <읽기자료 2>를 읽고, 추천 알고리즘의 방식을 각각 정리해 봅시다. -콘텐츠 기반 필터링: -협업 필터링: ◈ 기본활동 6) <읽기자료 3>을 읽고, 알고리즘이 플랫폼 종사자(노동자)를 어떤 방식으로 통제하고 있는지 기사의 내용을 정리해 봅시다. - 5. 생각 더하기 ■ 나와 가족·지인의 소셜 미디어 첫 화면을 살펴보고 비슷한 점과 다른 점을 찾아봅시다. 첫 화면을 통해 각각 어떤 콘텐츠를 추천하고 있는지 살펴보며 알고리즘이 어떻게 적용 되었는지 이유를 생각해 봅시다. ■ 기존의 추천 알고리즘에 어떤 알고리즘을 추가하면 사람을 행복하게 만들고 ‘인간성’을 담을 수 있을지 방법을 제안해 봅시다. 6. 참고 자료 ■ 에코 체임버(Echo Chamber) 방송에서 메아리 효과를 위해 만든 폐쇄 공간을 가리키는 용어로, 인터넷상에서 자신의 생각과 신념, 견해가 비슷한 사람들끼리 소통하고 정보를 공유하여 자신들이 가진 신념을 더욱 확신하고 강화하는 상황을 나타낸다. 이는 그룹 내 의견 일치를 강조하며 다른 의견을 거부하는 경향을 보여 극단주의의 배경이 되기도 한다. <출처: 동아일보 2023-09-22> /이리북일초 윤지선 교사