Ch.04

로지스틱 회귀 (Logistic Regression): 합격일까 불합격일까?

선형 회귀가 '예상 점수'를 예측한다면, 로지스틱 회귀는'YES or NO' 를 판별하는 분류 전문가입니다. 예를 들어, "공부 시간에 따른 시험 점수"를 맞히는 게 아니라, "이 점수면 합격(1) 일까 불합격(0) 일까?"를 맞힙니다. 이를 위해 점수를 0과 1 사이의'확률' 로 바꿔주는 시그모이드 함수 라는 도구를 사용합니다.

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 머신러닝 흐름을 한눈에 보세요.

z

\sigma(z) = \frac{1}{1+e^{-z}}

z

로지스틱 회귀: 합격일까 불합격일까?

z

운명의 커트라인 (결정 경계) — 시그모이드 함수가 "합격 확률은 0.7(70%)입니다"라고 알려주면, 모델은 최종 결정을 내려야 합니다. 보통 0.5(50%) 를 기준으로 삼습니다. 확률이 0.5 이상이면 1(Yes/양성), 0.5 미만이면 0(No/음성) 으로 분류합니다.

z = wx + b

\sigma(z) = \frac{1}{1+e^{-z}}

세상은 '예/아니오' 투성이 — 스팸 메일인가? (Yes/No), 암인가? (Yes/No), 고객이 물건을 살까? (Yes/No). 현실 세계의 수많은 문제는 두 가지 중 하나를 선택 하는 이진 분류(Binary Classification) 문제입니다. 로지스틱 회귀는 이 분야의 가장 기초가 되는 모델입니다.

확신을 숫자로 보여준다 — 단순히 "합격입니다"라고 하는 것보다, "합격 확률이 98% 입니다"라고 하면 훨씬 신뢰가 가죠? 로지스틱 회귀는 단순 분류를 넘어, 모델이 그 결과에 대해 얼마나 확신하는지(확률) 를 알려주기 때문에 의사결정에 매우 유용합니다.

딥러닝으로 가는 징검다리 — 인공지능(딥러닝)의 신경망 하나하나는 사실 로지스틱 회귀와 매우 비슷하게 작동합니다. 이 개념을 확실히 잡으면 나중에 딥러닝을 배울 때 "아, 이게 그거였구나!" 하고 쉽게 이해할 수 있습니다.

스팸 필터 — 이메일의 제목이나 특정 단어를 분석해 "이 메일이 스팸일 확률"을 계산하고, 일정 확률이 넘으면 스팸함으로 보냅니다.

의료 진단 AI — 환자의 엑스레이 사진이나 혈액 검사 수치를 입력받아 "특정 질병이 있을 확률"을 예측하여 의사의 진단을 돕습니다.

마케팅 및 추천 — "이 고객이 이번 달에 서비스를 해지할까?", "이 유저가 광고를 클릭할까?" 등을 예측하여 맞춤형 쿠폰을 보내거나 광고를 보여줍니다.

z = w_1 x_1 + w_2 x_2 + \cdots + b