← 목록으로
고객 특성 분류 로직 2026.03.18 ✍️ 최하영 nonstop

캐릭터 페르소나 지수 산정

6개의 성향 지수를 산출하고, 회원별 최고 T-score를 가진 지수를 해당 대표 페르소나로 선택하였습니다.

캐릭터 페르소나 지수 산정

페르소나 설계의 목적

프로젝트의 목적은 데이터 모델링을 넘어 CRM/CPD 영역까지 도달하는 것입니다. 고객의 데이터를 단순히 저장, 조회하는데 그치지 않고 고객의 이용 성향을 직관적으로 이해할 수 있는 형태로 구조화하는 것입니다.

통신 서비스 고객은 상품 탐색, 혜택 활용, 멀티 디바이스 이용, 가족 결합, 보안 서비스 이용등 서로 다른 특성을 보이기 때문에, 이를 하나의 기준으로 해석할 수 있는 체계가 필요합니다.

이에 따라 프로젝트에서는 여러 원천 데이터를 지수화 하고, 가장 두드러진 성향을 대표 페르소나로 부여함으로써 운영자가 고객 특성을 더 쉽게 파악하고 추천, 혜택 제안, 상담, 마케틱 분류 등에 활용할 수 있도록 설계합니다.

페르소나 모델 개요

고객 데이터를 기반으로 6개의 성향 지수를 산출하고, 이를 표준화 한 뒤 가장 두드러진 성향을 대표 페르소나로 부여하는 구조로 설계 했습니다.

먼저 회원별로 탐색, 혜택 활용/트랜드, 멀티 디바이스, 가족/홈 결합도, 인터넷/보안, 안정성의 6개 raw 지수를 계산하였습니다. 이후 지수별 분포 차이를 보정하기 위해 T-score로 표준화하고, 회원별 최고 T-Score를 가진 지수를 해당 대표 페르소나로 선택하였습니다.

본 모델은 원천데이터 → 지수 산출 → 표준화 → 대표 페르소나 부여의 흐름으로 동작하며, 복잡한 고객 데이터를 운영 관점에서 해석 가능한 형태로 전환하는 것을 목표로 합니다.

6개 페르소나 정의

6개 **페르소나**로 구분하였습니다. 각 페르소나는 특정 행동 패턴이나 서비스 이용 특성을 대표하며, 고객 데이터를 해석하기 위한 기준 역할을 합니다.

참고 : 6개 페르소나는 실제 운영 데이터의 군집 분석 결과가 아니라, 통신 도메인의 특성과 현재 확보 가능한데이터 구조를 바탕으로 설계한 가설적 모델입니다. 이후 실데이터가 충분히 축적되면 기준과 구성을 보정할 수 있도록 설계하였습니다.

페르소나별 지수 설계

탐색 지수

탐색 지수는 고객이 상품과 서비스를 얼마나 적극적으로 탐색하고 비교하는지를 나타내는 지수입니다.

본 프로젝트에서는 최근 7일 기준의 상품 상세 보기 버튼 클릭 횟수 , 내 상품 이랑 비교 하기 데이터를 사용해 탐색 성향을 계산합니다.

상품 상세 조회는 고객의 기본적인 관심도를 보여주고, 비교 행동은 실제 선택을 고민하는 더 강한 탐색 신호로 볼 수 있습니다.

따라서 비교 행동에는 더 큰 가중치를 두어, 다음과 같이 raw 지수를 정의하였습니다.

explore_raw = log1p(click_product_detail_cnt) + 3 * log1p(click_compare_cnt)

로그 변환을 적용한 이유는 일부 활동량이 큰 고객의 값이 지나치게 커지는 것을 완화하고, 전체 분포를 보다 안정적으로 반영하기 위해서입니다.

혜택 활용/트렌드 지수

혜택 활용/트렌드 지수는 고객이 쿠폰, 부가서비스 , 요금제 변경과 같은 혜택 및 최신 상품 흐름에 얼마나 적극적으로 반응하는지를 나타내는 지수입니다.

본 프로젝트에서는 부가서비스 구독중인 횟수, 최근 7일 기준 쿠폰 사용 횟수 그리고 상품 변경을 완료한 횟수를 활용해 해당 성향을 계산합니다.

부가서비스 가입은 추가 혜택에 대한 관심을 보여주고, 쿠폰 사용은 실제 혜택 활용 행동을 의미한다. 또한 요금제 변경 성공 이력은 새로운 상품이나 조건 변화에 적극적으로 반응했다는 신호로 볼 수 있다.

이에 따라 raw 지수는 다음과 같이 정의하였다.

benefit_trend_raw = log1p(부가서비스 구독중인 횟수) + log1p(최근 7일 기준 쿠폰 사용 횟수) + log1p(상품 변경을 완료한 횟수)

멀티 디바이스 지수

멀티 디바이스 지수는 고객이 스마트워치, 태블릿, 데이터 쉐어링과 같은 기능을 함께 활용하는 정도를 나타내는 지수입니다.

본 프로젝트에서는 스마트워치 구독 여부 , 태블릿 사용 여부, 쉐어링 데이터 비율을 기준으로 멀티 디바이스 성향을 계산합니다.

이에 따라 raw 지수는 다음과 같이 정의하였습니다.

multi_device_raw = watch_flag + tablet_flag + sharing_rate

여기서 쉐어링 데이터 사용량 비율은 요금제에서 제공하는 테더링 제공량 테더링의 사용량을 비율로 계산합니다.

가족/홈 결합도 지수

image.png

가족/홈 결합도 지수는 고객이 가족 단위 결합과 홈 서비스 중심으로 서비스를 이용하는 정도를 나타내는 지수입니다. 본 프로젝트에서는 family_member_cnt, has_internet_iptv_bundle, children_count를 기준으로 해당 성향을 계산한다.

동일 family_group_id 내 구성원 수는 가족 단위 이용 규모를 보여주고, 인터넷·IPTV 결합 여부는 홈 서비스 중심 이용 성향을 나타낸다. 또한 children_count는 요금제 사용자의 자녀수를 나타낸다.

이에 따라 raw 지수는 다음과 같이 정의하였다.

family_home_raw = log1p(family_member_cnt) + has_internet_iptv_bundle + log1p(children_count)

로그 변환은 가족 구성원 수나 자녀 수가 큰 경우 값이 과도하게 커지는 것을 완화하기 위해 적용하였습니다.

이를 통해 본 지수는 개인 단위 이용보다 가족·가정 중심으로 서비스가 묶여 있는 고객의 특성을 표현하도록 설계하였습니다.

인터넷 보안 지수

image.png

인터넷/보안 지수는 고객이 인터넷 서비스와 보안 관련 부가서비스를 얼마나 함께 이용하는지를 나타내는 지수입니다.

본 프로젝트에서는 인터넷 서비스 사용 여부, 보안서비스 구독 갯수 를 기준으로 해당 성향을 계산합니다.

이에 따라 raw 지수는 다음과 같이 정의하였습니다.

internet_security_raw = 0.7 * internet_flag + 0.3 * log1p(security_addon_cnt)

인터넷 서비스 이용 자체를 더 핵심적인 신호로 보고 더 큰 가중치를 두었으며, 보안 부가서비스 수는 보조적인 강화 요소로 반영하였습니다.

이를 통해 본 지수는 인터넷 기반 이용과 보안 관심 성향을 함께 가진 특성을 표현하도록 설계하였습니다.

안정성 지수

image.png

안정성 지수는 고객의 전반적인 이용 안정성과 충성도를 나타내는 지수입니다.

본 프로젝트에서는 멤버십 등급, 사용자 상담 별점 점수, 해당 월 요금 납부 기준을 기준으로 해당 성향을 계산합니다.

멤버십 등급은 장기 이용과 우수 고객 여부를 반영합니다. 사용자 상담 별점 점수는 서비스 경험에 대한 고객 평가를 나타냅니다. 요금 납부는 안정적인 상태를 보여주는 지표로 활용합니다.

stability_raw = (membership_score + rating_score + paid_score) / 3

여기서 멤버십 점수는 VVIP=100, VIP=80, GOLD=60, NULL=0

만족도 점수는 (avg_monthly_satisfaction / 5.0) * 100

납부 점수는 billing.is_paid 가 참이면100 아니면 0으로 계산합니다.

이를 통해 본 지수는 단순 사용량이 아니라, 고객의 서비스 만족도와 납부 안정성, 멤버십 수준을 종합적으로 반영하는 지표로 설계하였습니다.

T-score 표준화 방식

각 지수는 사용하는 데이터와 값의 범위가 서로 다르기 때문에, raw 값만으로는 직접 비교하기 어렵습니다.

그래서 본 프로젝트에서는 지수별 raw 값을 평균과 표준편차 기준으로 표준화한 뒤, 이를 T-score로 변환하였습니다.

계산 방식은 다음과 같습니다.

이 방식으로 변환하면 각 지수는 평균 50을 기준으로 비교할 수 있게 됩니다. 즉, 어떤 고객의 특정 지수가 50보다 높으면 해당 성향이 평균보다 강하다고 해석할 수 있고, 50보다 낮으면 평균보다 약하다고 볼 수 있습니다.

또한 예외적으로 표준편차가 0인 경우에는 모든 회원의 해당 지수를 50으로 처리하여 비교 불가능한 상황을 안정적으로 처리하도록 설계하였습니다.

최종 페르소나 선정 로직

최종 페르소나는 회원별로 6개 T-score를 비교한 뒤, 가장 높은 T-score를 가진 지수 1개를 대표 성향으로 선택하는 방식으로 결정합니다.

선택된 지수는 미리 정의한 매핑 규칙에 따라 해당 페르소나 코드로 변환됩니다. 예를 들어 탐색 지수가 가장 높으면 SPACE_SHERLOCK, 멀티 디바이스 지수가 가장 높으면 SPACE_OCTOPUS가 부여되는 구조입니다.

활용 방안

이렇게 산출한 페르소나는 운영자가 고객을 더 직관적으로 이해하고, 고객별 특성에 맞는 액션을 설계하는 데 활용할 수 있습니다. 단순한 원천 데이터 조회보다, 고객의 대표 성향을 한 번에 파악할 수 있다는 점이 가장 큰 장점입니다.

예를 들어 탐색 성향이 높은 고객에게는 상품 추천이나 비교형 콘텐츠를 제안할 수 있고, 혜택 활용 성향이 높은 고객에게는 쿠폰이나 프로모션 안내를 우선 제공할 수 있습니다. 또한 가족/홈 결합 성향이 높은 고객에게는 인터넷·IPTV 결합 상품을, 인터넷/보안 성향이 높은 고객에게는 보안 부가서비스를 연결하는 방식으로 활용할 수 있습니다.

즉, 본 페르소나 모델은 추천, 혜택 제안, 상담, 마케팅 분류와 같은 운영 시나리오에서 고객을 해석하는 기준 정보로 활용할 수 있도록 설계하였습니다.

#캐릭터 #6대 지수 #로그