반응형

데이터베이스 내장함수 활용 완전정복 🚀

SQL 문법만 아신다고요?
진짜 실무는 내장함수로 승부 납니다!
데이터 가공의 핵심 무기, 이제부터 제대로 알아봅시다!

 

 

안녕하세요! 😊

오늘은 SQL을 조금 더 실용적이고 똑똑하게 다루기 위해 꼭 알아야 할 데이터베이스 내장함수에 대해 이야기해볼까 해요.

단순한 SELECT, INSERT에서 머무르던 시절은 이제 안녕~ 문자열을 다듬고, 날짜를 변환하고, 숫자를 정리하는 실전 기술들을 함께 배워볼 거예요.

특히나 초보자분들도 이해할 수 있도록 예제 중심으로 준비했으니 끝까지 따라오시면 어느새 데이터 마법사가 되어 있을지도 모릅니다✨

자, 그럼 지금부터 출발해볼까요?

1. 단일행 내장 함수란? 🧩

SQL에서 단일행 내장 함수란, 하나의 행에 대해 하나의 결과값을 반환하는 함수들을 말합니다.

즉, 테이블의 각 행마다 각각 계산을 수행하고 결과를 돌려주는 함수들이죠.

복잡한 계산, 문자열 처리, 날짜 포맷 변경 등 일일이 수동으로 처리하려면 머리 아픈 작업들을 이 함수들이 척척 대신 처리해줍니다.

단일행 함수는 아래와 같이 크게 네 가지로 나눌 수 있어요:

  • 문자열 함수: 텍스트 다듬기, 길이 계산, 문자열 결합 등
  • 숫자 함수: 반올림, 절댓값 계산, 올림/내림 처리 등
  • 날짜/시간 함수: 현재 시각 불러오기, 날짜 더하기/빼기, 포맷 변경 등
  • 변환 함수: 데이터 타입 변환, NULL 처리 등

📌 실무에서 단일행 함수가 중요한 이유

실제 업무에서 데이터를 직접 눈으로 보고 수정하거나 정제하는 건 너무 비효율적이죠.

예를 들어

이름 뒤에 불필요한 공백이 있다거나, 날짜 형식이 들쭉날쭉하거나, 가격이 정수로 처리돼야 할 때...

이럴 때 단일행 함수 하나면 수천, 수만 건의 데이터를 한 번에 처리할 수 있어요!

🛠️ 대표 예시: UPPER(), LOWER(), LENGTH()

함수 설명 예시
UPPER() 문자를 모두 대문자로 변환 UPPER('hello') → 'HELLO'
LOWER() 문자를 모두 소문자로 변환 LOWER('HELLO') → 'hello'
LENGTH() 문자열의 길이를 반환 LENGTH('hello') → 5

앞으로 각 유형별로 더 디테일하게 들어갈 테니까, 지금은 전체 그림만 이해하시면 돼요!

다음 섹션에서는 가장 많이 쓰이는 문자열 함수들을 하나하나 파헤쳐보겠습니다.

 

 

2. 문자열 함수 정복하기 (CONCAT, LENGTH 등) 🔡

문자열 함수는 텍스트 데이터를 다루는 데 필수예요.

고객 이름을 조합하거나, 불필요한 공백을 제거하고, 특정 위치의 글자만 뽑아내는 작업은 거의 매일 한다고 봐야 합니다.

이번 장에서는 실무에서 가장 많이 쓰는 네 가지 함수,

CONCAT, LENGTH, SUBSTRING, REPLACE를 예제로 설명드릴게요.

🔗 CONCAT(): 문자열 결합

CONCAT() 함수는 두 개 이상의 문자열을 붙여주는 역할을 합니다.
예를 들어,

성과 이름이 따로 저장되어 있다면 이걸 하나의 전체 이름으로 만드는 데 유용하죠.

예시 결과
CONCAT('김', '민수') 김민수
CONCAT(이름, '(', 직책, ')') 홍길동(과장)

🔢 LENGTH(): 문자열 길이

LENGTH() 함수는 문자열이 몇 자로 구성되어 있는지 알려줘요.

고객 ID가 너무 짧거나 너무 길 경우를 필터링하는 데 유용합니다.

  • LENGTH('hello') → 5
  • LENGTH('데이터') → 9 (UTF-8 환경에서는 한글 1글자가 3바이트로 처리됨)

✂️ SUBSTRING(): 문자열 일부 추출

SUBSTRING() 함수는 문자열에서 특정 위치의 일부만 잘라낼 때 사용돼요.

주민등록번호에서 생년월일만 뽑는다거나, 전화번호 뒷자리만 보는 경우 아주 유용합니다.

예시 결과
SUBSTRING('20250406', 1, 4) 2025
SUBSTRING('홍길동과장', 1, 3) 홍길동

🔁 REPLACE(): 특정 문자 교체

REPLACE()는 문자열 안에서 특정 단어를 다른 단어로 바꿔주는 함수입니다.
광고 문자에서 "[광고]"를 없앤다거나, 전화번호 형식에서 '-'를 제거할 때 자주 써요.

  • REPLACE('010-1234-5678', '-', '') → 01012345678
  • REPLACE('[광고]특가상품!', '[광고]', '') → 특가상품!

이처럼 문자열 함수만 잘 활용해도 데이터 가공의 절반은 끝난 셈이에요.
다음 섹션에서는 또 하나의 실무 핵심, 날짜/시간 함수에 대해 살펴볼게요.

출생년도, 가입일, 오늘 기준으로 몇 일 지났는지… 날짜 다루는 게 은근히 어렵거든요!

 

 

3. 날짜와 시간 함수 완전 분석 (NOW, DATE_ADD 등) 📆

날짜/시간 함수는 실무에서 진짜 많이 쓰여요.

회원 가입일, 주문일, 배송 예정일, 생년월일… 이 모든 데이터가 ‘날짜’ 형태로 저장되잖아요?

단순히 저장만 해선 의미가 없고,

가공해서 '오늘 기준 몇 일 지났는지',

              '이번 달에 가입한 사람은 몇 명인지' 같은 정보를 뽑아내야 쓸모가 생깁니다.

 

오늘은 NOW(), DATE_FORMAT(), DATE_ADD() 같은 꿀 함수들을 함께 살펴볼게요 🔍

⏰ NOW(): 현재 날짜와 시간

NOW()는 지금 이 순간의 날짜와 시간을 반환하는 함수입니다.

서버 시간 기준이기 때문에 실시간 로깅이나 가입일 자동 기록 등에 자주 사용돼요.

SQL 예시 결과 예시
SELECT NOW(); 2025-04-06 22:32:18

📅 DATE_FORMAT(): 날짜 포맷 변경

날짜는 DB 안에서 보관할 땐 괜찮지만, 그대로 사용자에게 보여주기엔 좀 불친절하죠?
DATE_FORMAT() 함수는 YYYY년 MM월 DD일 같은 친절한 형식으로 바꿔주는 데 유용해요.

예시 설명
DATE_FORMAT(NOW(), '%Y-%m-%d') ‘2025-04-06’ 형식으로 출력
DATE_FORMAT(NOW(), '%Y년 %m월 %d일') ‘2025년 04월 06일’로 출력

➕ DATE_ADD(): 날짜 계산

예:

“가입일로부터 30일 후”를 알고 싶을 때 유용한 함수가 바로 DATE_ADD()입니다.
날짜에 일(day), 월(month), 연(year) 등을 더하거나 뺄 수 있어요.

  • DATE_ADD('2025-04-01', INTERVAL 7 DAY) → 2025-04-08
  • DATE_ADD(NOW(), INTERVAL 1 MONTH) → 다음 달 오늘

🧠 정리 팁

  • NOW() → 현재 시간 얻기
  • DATE_FORMAT() → 사용자에게 보여줄 날짜 형식으로 변환
  • DATE_ADD() → 특정 날짜에 일/월/년 더하기

 

다음 섹션에서는 계산의 핵심, 숫자 함수로 넘어가 볼게요.

가격 반올림, 절댓값, 올림·내림 처리까지... 실수형 숫자 다루는 방법을 정리해드립니다 💡

 

 

4. 숫자 함수 제대로 쓰기 (ROUND, CEIL, ABS 등) 🔢

숫자 데이터를 다룰 때 가장 많이 하는 실수?

바로 반올림 또는 절삭을 제대로 못 하는 거예요.

예를 들어,

할인율 계산 후 소수점 몇 자리까지 보여줄지, 총액을 올림해서 결제 처리할지…

이런 게 바로 실전 문제죠.

 

여기서는 대표적인 숫자 처리 함수인 ROUND(), CEIL(), FLOOR(), ABS()를 소개할게요!

🔘 ROUND(): 반올림

ROUND()는 특정 소수점 자리까지 반올림하는 함수입니다.

계산 결과를 보기 좋게 정리할 때 사용되죠.

SQL 결과
ROUND(3.14159, 2) 3.14
ROUND(99.999) 100

🔼 CEIL(): 올림

CEIL() 함수는 소수점을 무조건 올림해서 정수로 만들어줍니다.

예:

택배비, 결제 금액 등 반올림보다 올림이 필요한 상황에서 사용!

  • CEIL(5.2) → 6

🔽 FLOOR(): 내림

FLOOR()무조건 내림하는 함수예요.

할인 계산에서 고객에게 유리하게 금액을 조정할 때 종종 사용됩니다.

  • FLOOR(5.9) → 5

➖ ABS(): 절댓값

ABS() 함수는 음수를 양수로 바꾸는 절댓값 계산용입니다.

실수 계산에서 마이너스 값만 제거할 때 편리하죠.

  • ABS(-100) → 100

🎯 언제 어떤 숫자 함수를 써야 할까?

상황 추천 함수
소수 둘째 자리까지 보여줄 때 ROUND()
결제 금액 올림 처리 CEIL()
할인 금액 내림 계산 FLOOR()
손실 수치를 양수로 정리 ABS()

숫자 함수를 제대로 알면 데이터 품질이 달라지고, 고객에게 보여주는 정보도 훨씬 깔끔해져요.


이제 다음 섹션에서 이 모든 함수들을 활용한 실전 예제를 함께 풀어보겠습니다! 💪

 

 

5. 실전 예제: 생년월일 가공, 상품 정보 조합 💡

지금까지 배운 문자열 함수, 날짜 함수, 숫자 함수들을 실전에 어떻게 활용할 수 있을까요?
이제는 그냥 이론만 보지 말고 직접 쿼리를 작성해 보면서 감을 잡아야 합니다.

그래서 준비한 2가지 시나리오! 😎

🧓 회원 테이블에서 생년월일 가공하기

가상의 members 테이블에 다음과 같은 데이터가 있다고 가정해봅시다.

id name birth_date
1 김민수 1994-03-21
2 이수지 1987-07-08

우리는 여기서 두 가지 작업을 할 거예요:

  1. 생년월일을 'YYYY년 MM월 DD일' 형식으로 변환
  2. 오늘 기준 나이 계산

아래 쿼리를 보세요:

SELECT
  name,
  DATE_FORMAT(birth_date, '%Y년 %m월 %d일') AS formatted_birth,
  YEAR(CURDATE()) - YEAR(birth_date) AS age
FROM
  members;

단 두 줄의 함수로 날짜 형식도 바꾸고 나이도 계산했죠?

이게 바로 SQL 내장함수의 파워입니다! 💪

🛍️ 상품명 + 가격 문자열 만들기

이번엔 products 테이블에서 상품명과 가격을 한 줄로 묶어서 출력해보겠습니다.
고객에게 ‘상품명 (가격원)’ 형태로 보여주기 위한 가공이죠!

SELECT
  CONCAT(product_name, ' (', FORMAT(price, 0), '원)') AS product_info
FROM
  products;

CONCATFORMAT 조합만으로 상품 정보가 확! 깔끔해지죠?

실무에서 이런 식으로 텍스트 조합은 진짜 많이 씁니다!

✅ 실전 포인트 요약

  • DATE_FORMAT()으로 날짜 가독성 향상
  • YEAR(CURDATE()) - YEAR(생년) 방식으로 간단한 나이 계산
  • CONCAT() + FORMAT()으로 상품 정보 포맷화

이제 내장함수들이 실무에서 얼마나 강력한 무기인지 실감나시죠?

 

6. 마무리 요약 및 실무 적용 팁 🎯

여기까지 따라오셨다면 이제 SQL 내장 함수에 대한 기본기를 완벽히 다지셨다고 자신 있게 말씀드릴 수 있어요!

단순히 SELECT만 쓰던 시절을 지나, 이제는 문자열·숫자·날짜 데이터를 자유롭게 가공할 수 있는 실력을 갖추게 된 거죠.

📌 핵심 요약 정리

  • 문자열 함수: CONCAT, LENGTH, SUBSTRING, REPLACE
  • 날짜 함수: NOW, DATE_FORMAT, DATE_ADD
  • 숫자 함수: ROUND, CEIL, FLOOR, ABS

💼 실무 적용 팁

  • 보고서 출력용 데이터 만들 땐 CONCAT() + FORMAT() 조합이 최고!
  • 날짜 조건 검색 시 NOW()DATE_ADD()를 조합해 범위 지정
  • 숫자 계산 후 소수점 자리 제어 시 ROUND(), CEIL(), FLOOR() 필수!

 

이 글을 통해 여러분이 데이터베이스 내장 함수를 자유자재로 활용할 수 있게 되었다면,

그보다 더 뿌듯할 수 없겠네요 😊

 

 

반응형
반응형

파이썬 문자열 마스터하기: 인덱싱, 슬라이싱, 포맷팅, 함수 총정리

여러분, 문자열 처리만 제대로 익혀도 파이썬 실력이 한 단계 확 올라간다는 사실, 알고 계셨나요?

 

 

안녕하세요!

오늘은 파이썬 초보자라면 꼭 알아야 할 문자열 다루기에 대해 다뤄보려 해요.

파이썬에서 문자열은 단순한 텍스트 데이터가 아닙니다.

문자열 인덱싱과 슬라이싱, 포맷팅, 함수들을 잘 활용하면 데이터 처리, 출력 형식 지정, 텍스트 조작 등 다양한 작업을 아주 효율적으로 처리할 수 있거든요.

이 글에서는 헷갈리기 쉬운 인덱스와 슬라이스 개념부터, 초보자들이 자주 틀리는 포맷팅 방식, 그리고 실무에서 자주 쓰이는 문자열 함수들까지 전부 친절하게 알려드릴게요.

1. 문자열 인덱싱의 원리와 활용법 🔍

문자열 인덱싱(Indexing)은 문자열 안의 특정 문자를 위치를 기준으로 가져오는 방식이에요.

마치 책갈피처럼, 문자열의 글자마다 고유한 번호(index)가 매겨지기 때문에, 우리가 원하는 문자를 숫자로 불러오는 거죠!

문자열 인덱싱의 기본 개념

파이썬에서 문자열은 0부터 시작하는 인덱스를 가지고 있어요.

왼쪽에서부터는 0, 1, 2... 순서대로, 오른쪽에서부터는 -1, -2, -3... 이렇게 부여되죠.

text = "Python"
print(text[0])   # P
print(text[-1])  # n

text[0]는 문자열의 첫 글자인 'P'를, text[-1]은 마지막 글자인 'n'을 반환해요.

이처럼 앞에서든 뒤에서든 원하는 글자 하나만 뽑아낼 수 있어요.

문자 인덱싱 실습 예제

문자열 인덱스 결과
"Hello, World!" [7] W
"Python" [-2] o

인덱싱에서 주의할 점

  • 인덱스 범위를 벗어나면 IndexError가 발생해요.
  • 음수 인덱스를 사용할 때는 문자열 길이와 비교해서 신중히 접근하세요.

문자열 인덱싱은 파이썬의 핵심 개념 중 하나로, 나중에 리스트, 튜플, 문자열 파싱 작업에서도 자주 사용되니까 지금 확실히 익혀두면 정말 좋아요!

 

 

2. 문자열 슬라이싱으로 원하는 부분 추출 ✂️

문자열에서 특정 구간을 잘라내고 싶을 때는 슬라이싱(Slicing)을 사용해요.

슬라이싱은 문자열[시작:끝] 형태로 사용하며,

시작 인덱스는 포함되고 끝 인덱스는 제외된다는 점! 꼭 기억해두세요.

text = "Hello, Python!"
print(text[0:5])   # Hello
print(text[7:13])  # Python

슬라이싱의 다양한 형태

슬라이싱 구문 설명
text[:5] 처음부터 5번째 문자 전까지 (0~4)
text[7:] 7번째 문자부터 끝까지
text[:-1] 마지막 문자 제외하고 전부
text[::2] 전체 문자열에서 한 칸씩 건너뛰며 출력

실제 예제로 감 잡기

msg = "파이썬 문자열 슬라이싱 연습"
print(msg[:3])     # 파이썬
print(msg[-3:])    # 연습
print(msg[4:8])    # 문자열

슬라이싱은 단순히 문자열을 잘라내는 기능을 넘어서, 특정 형식의 데이터를 추출하거나 가공하는 데 자주 사용돼요.

예를 들어

주민등록번호에서 생년월일만 뽑거나, 파일 경로에서 확장자만 잘라내는 경우에도 쓰이죠.

활용 팁 💡

  • text[::-1]을 사용하면 문자열을 뒤집을 수 있어요.
  • 슬라이싱은 리스트나 튜플에도 그대로 사용 가능하니 꼭 익혀두세요!

파이썬 슬라이싱은 간단해 보이지만, 익숙해지면 정말 다재다능한 무기가 되어줍니다.

초보자분들은 꼭 손으로 직접 입력해보며 연습해보세요!

 

 

3. 문자열 포맷팅: %, format(), f-string 비교 🧩

출력 결과를 보기 좋게 다듬고 싶다면?

바로 문자열 포맷팅이 필요해요.

포맷팅은 문자열 안에 변수를 넣거나 숫자의 형식을 지정할 때 사용되는데요,

파이썬에는 대표적으로 % 포맷 방식, format(), 그리고 f-string 방식이 있어요.

각각의 특징을 예제와 함께 비교해볼게요!

① % 포맷 방식

name = "홍길동"
age = 30
print("이름: %s, 나이: %d" % (name, age))

%s는 문자열, %d는 정수, %f는 실수를 의미해요.

예전 방식이지만 여전히 사용되고 있어요.

② format() 함수 방식

print("이름: {}, 나이: {}".format(name, age))
print("이름: {0}, 나이: {1}".format(name, age))
print("이름: {n}, 나이: {a}".format(n=name, a=age))

format()은 인덱스나 키워드 인자를 활용할 수 있어 유연하고 다양한 방식의 문자열 출력이 가능해요.

③ f-string (파이썬 3.6 이상)

print(f"이름: {name}, 나이: {age}")

f-string은 가장 간결하고 직관적인 최신 방식이에요.

변수명만 중괄호에 넣으면 바로 출력 가능해서 특히 많이 사용돼요.

 

포맷팅 비교 요약표

포맷팅 방식 장점 단점
% 간단한 출력에 유용 복잡한 포맷에는 불리함
format() 인덱스/이름 지정 등 다양한 형태 가능 코드 길이가 조금 길어질 수 있음
f-string 가장 간결하고 가독성이 좋음 파이썬 3.6 이상에서만 사용 가능

상황에 따라 포맷팅 방식이 달라질 수 있지만, 최근에는 대부분 f-string을 선호해요.

속도도 빠르고, 눈에 잘 들어오거든요 😎

 

 

4. 자주 쓰이는 문자열 함수 총정리 📚

파이썬 문자열은 단순한 텍스트 그 이상이에요.

문자열 객체가 수많은 유용한 함수들을 내장하고 있어서, 복잡한 텍스트 처리도 단 몇 줄이면 OK!

여기선 초보자부터 중급자까지 꼭 알아야 할 함수들을 분야별로 정리해볼게요.

① 문자열 검색 관련 함수

  • find(): 처음 찾은 위치 반환, 없으면 -1
  • index(): 찾는 문자열의 위치 반환, 없으면 오류 발생
  • count(): 특정 문자가 몇 번 등장하는지 세기

② 대소문자 및 공백 처리

  • upper(): 모든 문자를 대문자로
  • lower(): 모든 문자를 소문자로
  • strip(): 양쪽 공백 제거 (lstrip(), rstrip()도 있음)

③ 문자열 변형

  • replace(old, new): old를 new로 바꾸기
  • split(sep): 문자열을 리스트로 분리
  • join(): 리스트 요소를 문자열로 연결
  •  

예제: 함수 조합으로 문장 다듬기

text = "   Hello, Python!    "
result = text.strip().replace("Python", "World").upper()
print(result)  # HELLO, WORLD!

strip()으로 양쪽 공백 제거, replace()로 단어 변경, upper()로 대문자 변환!

이런 식으로 여러 함수를 체인처럼 이어쓰기가 가능해요.

실무에서도 문자열 정리는 거의 필수에요.

예를 들어

CSV 데이터 전처리, 사용자 입력 정리, HTML 텍스트 추출 등 다양한 곳에 쓰이죠.

지금 소개한 함수들만 제대로 익혀도 문자열 다루는 데 큰 무기가 될 거예요!

 

 

5. 문자열 다룰 때 꼭 알아야 할 팁과 주의사항 ⚠️

문자열은 파이썬에서 아주 자주, 아주 널리 쓰이는 데이터 타입이에요.

그런데 간단해 보이는 문자열도 조금만 실수하면 오류가 나거나 예상과 다른 결과가 나와서 당황하게 되죠.

지금부터는 문자열 다룰 때 꼭 주의해야 할 부분과 팁들을 정리해볼게요!

① 문자열은 '변경 불가능(immutable)'하다

문자열은 한 번 생성하면 값을 바꿀 수 없어요.

리스트처럼 특정 인덱스에 값을 직접 대입하려 하면 오류가 납니다.

text = "hello"
text[0] = "H"  # TypeError 발생!

대신 새로운 문자열을 만들어야 해요: text = "H" + text[1:]

② 줄바꿈 문자와 공백은 예외 없이 처리!

\n은 줄바꿈, \t은 탭.

눈에는 안 보이지만 존재하는 문자들이에요.

특히 사용자 입력 데이터에는 공백이 자주 섞여 있으니 strip() 필수!

user_input = "  yes\n"
print(user_input.strip())  # "yes"

③ 문자열 비교는 공백까지 포함해서!

"yes" == " yes " 는 False입니다!

문자열 비교 시에는 공백 제거와 대소문자 처리를 잊지 마세요.

a = "YES"
b = " yes "
print(a.lower() == b.strip().lower())  # True

④ 문자열 길이 체크는 len()으로!

입력값 유효성 검사, 조건 분기 등에 자주 쓰이는 len()은 정말 자주 쓰여요.

문자열이 비었는지도 len(s) == 0 또는 if not s:로 확인 가능해요.

문자열 다룰 때 실수 줄이는 팁 정리

상황
입력값 처리 strip(), lower() 함께 쓰기
특정 문자 포함 여부 'abc' in text로 확인
빈 문자열 검사 if not text: 또는 if text == ""

이런 사소한 실수 하나하나가 전체 코드의 신뢰도에 영향을 주기도 해요.

문자열 다루는 건 단순히 문자를 다루는 게 아니라, 데이터를 다루는 기본기라는 걸 잊지 마세요!

 

 

6. 실전 예제와 함께하는 문자열 실습 💡

문법만 안다고 해서 끝이 아니죠.

실제로 손으로 코딩해보고, 문자열을 직접 다뤄보는 실습이 정말 중요해요.

이번엔 앞에서 배운 인덱싱, 슬라이싱, 포맷팅, 문자열 함수들을 종합해서 실전 예제를 만들어볼게요.

실무에서 자주 마주치는 시나리오로 구성했으니 꼭 연습해보세요!

예제 1️⃣: 사용자 입력값 정리하기

사용자 입력값에 공백이 섞여 있다면?

불필요한 공백 제거, 대소문자 통일은 기본 중의 기본!

raw_input = "   YES\n"
cleaned = raw_input.strip().lower()
print(cleaned)  # "yes"

예제 2️⃣: 주민등록번호에서 생년월일 추출

문자열 슬라이싱을 활용해 특정 위치의 정보만 뽑아볼게요.

rrn = "901231-1234567"
birth = rrn[:6]
gender_code = rrn[7]
print(f"생년월일: {birth}, 성별코드: {gender_code}")

예제 3️⃣: 파일 확장자 추출기

문자열 메서드 중 split()join()을 활용해서 파일 확장자를 추출해보세요.

filename = "report_final_2025.pdf"
ext = filename.split('.')[-1]
print(f"파일 확장자: {ext}")  # pdf

예제 4️⃣: 문자열 뒤집기

파이썬의 슬라이싱 기능만 알면 문자열을 손쉽게 뒤집을 수 있어요!

word = "hello"
reverse = word[::-1]
print(reverse)  # "olleh"

미션 🎯

다음 문자열을 활용해서 실습해보세요!

text = "   Learn Python Programming NOW!  "
  • 앞뒤 공백 제거하기
  • "NOW!" → "NOW"로 바꾸기
  • 모두 소문자로 바꾸기

이렇게 실습 예제들을 따라 하다 보면, 문자열을 자유자재로 다루는 능력이 자연스럽게 길러질 거예요.

배운 내용을 코딩으로 반복 연습하는 게 가장 확실한 공부 방법이니까 꼭 해보세요!

 

 

마무리 ✨

지금까지 파이썬 문자열의 인덱싱, 슬라이싱, 포맷팅, 그리고 다양한 함수들을 차근차근 살펴봤습니다.

하나하나 별개로 보이지만, 실은 모두 연결된 하나의 흐름이라는 거, 느껴지셨나요?

문자열은 데이터 처리의 시작점이자 끝점이에요.

문자열을 자유롭게 다룰 수 있다는 건, 데이터를 내 마음대로 가공하고 표현할 수 있는 능력을 의미합니다.

실제 현업에서도 로그 분석, 사용자 입력 처리, CSV/JSON 파싱, API 응답 처리 등 거의 모든 영역에서 문자열을 마주하거든요.

처음에는 index, slice, format, strip, replace, split 같은 함수들이 어렵게 느껴질 수도 있어요.

하지만 여러 번 써보고, 실습해보고, 내 프로젝트에 적용해보면 어느새 익숙해질 거예요.

"함수는 외우는 게 아니라 써보는 것이다." 이 말, 꼭 기억해 주세요!

다음에는 파일 읽기, 정규표현식, 텍스트 전처리 등 더 재미있는 주제로 돌아올게요 😊

반응형
반응형

HAVING 절과 조건부 집계
: 집계함수를 한 단계 더 활용하는 방법

SQL의 GROUP BY는 알고 있지만, 그 결과에 조건을 걸 수 있는 HAVING 절은 아직 낯설게 느껴지시나요?

 

 

안녕하세요!

오늘은 SQL에서 데이터를 집계할 때 유용하게 사용할 수 있는 HAVING 절에 대해 자세히 알아보려 합니다.

많은 분들이 WHERE와 GROUP BY는 익숙하지만, 그 다음 단계인 HAVING 절의 쓰임새에 대해서는 헷갈리거나 잘 사용하지 않는 경우가 많아요.

하지만 데이터를 좀 더 정교하게 다루기 위해서는 꼭 알아야 할 부분이죠.

이번 글에서는 HAVING 절이 왜 필요한지, 그리고 어떻게 활용할 수 있는지 실습 예제를 통해 함께 알아보겠습니다.

이 글을 끝까지 읽으시면, 매출이 높은 상위 카테고리를 필터링하거나 조건에 맞는 그룹 데이터를 추출하는 방법까지 완벽하게 익히실 수 있어요.

자, 그럼 지금부터 HAVING 절의 매력에 빠져볼 준비 되셨나요? 😊

1. HAVING 절이란? 왜 필요할까

SQL에서 HAVING 절GROUP BY로 집계된 결과에 조건을 걸기 위해 사용됩니다.

일반적으로 조건을 걸 때는 WHERE 절을 많이 쓰지만, 이 절은 집계 함수(Aggregate Function)와 함께 사용할 수 없습니다.

그래서 등장한 것이 바로 HAVING입니다.

 

HAVING 절은 GROUP BY로 묶인 각 그룹에 대해 SUM, COUNT, AVG, MAX, MIN 등의 집계 함수를 기준으로 조건을 거는 데 쓰여요.

예를 들어,

전체 매출을 카테고리별로 묶은 뒤, 매출이 1,000만 원 이상인 카테고리만 보고 싶다면 HAVING 절이 꼭 필요하겠죠?

🚫 WHERE 절만으로는 안 되는 이유

  • WHERE 절은 집계 함수와 함께 사용 불가
  • HAVINGGROUP BY 이후의 결과를 필터링할 수 있음

📊 HAVING 절을 사용한 기본 예제

SELECT category, SUM(sales) AS total_sales
FROM sales_data
GROUP BY category
HAVING SUM(sales) > 10000000;

 

위 쿼리는 카테고리별 총 매출이 1,000만 원 이상인 경우만 결과로 보여줘요.

HAVING SUM(sales) > 10000000 부분이 바로 포인트입니다.

✔️ 왜 실무에서 자주 쓰일까?

  1. 조건에 맞는 매출/사용자/주문 데이터를 필터링해야 할 때
  2. 운영 보고서, 대시보드 생성 시 조건부 요약 필수
  3. 비즈니스 인사이트 도출을 위해 중요한 기준 필터링 필요

HAVING 절은 단순 통계를 넘어서 조건 기반 분석을 할 수 있도록 도와줍니다.

보고서나 BI툴에 쿼리를 연동할 때도 거의 필수처럼 등장하죠.

실무에서 데이터를 다룬다면 꼭 알아둬야 할 필수 기술이라고 할 수 있어요.

 

 

2. WHERE 절과 HAVING 절의 차이점

HAVING 절을 제대로 활용하려면, 먼저 WHERE 절과의 차이점을 확실히 이해하고 있어야 해요.

둘 다 '조건을 거는 문장'이라는 점에서 비슷해 보이지만, 작동하는 시점과 대상이 전혀 다릅니다.

🔍 WHERE vs HAVING 작동 시점 비교

항목 WHERE 절 HAVING 절
적용 시점 GROUP BY 전에 작동 GROUP BY 이후에 작동
적용 대상 개별 행(Row) 그룹(Group)
집계 함수 사용 불가능 ❌ 가능 ✅

즉, WHERE원천 데이터에 조건을 걸고, HAVING그룹핑된 결과에 조건을 거는 거예요.

📌 예제로 비교해 보기

1) 특정 지역만 조회 (WHERE 사용)

SELECT region, COUNT(*) 
FROM customer_data 
WHERE region = '서울'
GROUP BY region;

 

2) 가입자가 100명 이상인 지역만 조회 (HAVING 사용)

SELECT region, COUNT(*) AS total_users 
FROM customer_data 
GROUP BY region 
HAVING COUNT(*) >= 100;

 

같은 데이터셋이더라도 목적에 따라 WHERE 또는 HAVING 중 어떤 절을 써야 할지가 달라집니다.

조건이 행 단위냐, 그룹 단위냐가 핵심이에요!

💡 TIP: WHERE과 HAVING 같이 쓰기

두 절은 동시에 사용할 수 있습니다!

WHERE로 먼저 데이터를 필터링하고, 그 이후 HAVING으로 조건을 추가해 더 정교한 분석을 할 수 있어요.

SELECT region, COUNT(*) AS total_users
FROM customer_data
WHERE status = '활성'
GROUP BY region
HAVING COUNT(*) > 100;

 

3. HAVING 절 기본 예제

이제 HAVING 절이 어떤 역할을 하는지는 알았으니, 실제 예제를 통해 감을 잡아볼 시간이에요.

가장 기본적인 예제부터 단계별로 살펴보겠습니다.

📝 기본 예제: 상품별 주문 건수 필터링

상황: 어떤 쇼핑몰에서 상품별 주문 건수를 구한 뒤, 10건 이상 팔린 상품만 보고 싶다고 가정해볼게요.

SELECT product_name, COUNT(*) AS order_count
FROM orders
GROUP BY product_name
HAVING COUNT(*) >= 10;

 

이 쿼리는 주문 내역(orders) 테이블에서 상품별로 주문 수를 계산하고, 그 결과 중 10건 이상 주문된 상품만 출력합니다.

매출 상위 상품 분석이나 인기 상품 필터링에 아주 유용하죠.

📊 조건을 다양하게 바꿔보기

조건 HAVING 구문 예시
10건 이상 HAVING COUNT(*) >= 10
50건 미만 HAVING COUNT(*) < 50
정확히 100건 HAVING COUNT(*) = 100

HAVING 뒤에는 수치 비교 연산자, 논리 연산자 등도 자유롭게 조합해서 사용할 수 있어요.

예를 들어,

매출이 1,000만 원 이상이면서 주문 건수가 20건 이상인 상품을 추출하려면 다음처럼 쓰면 됩니다:

SELECT product_name, SUM(sales_amount) AS total_sales, COUNT(*) AS order_count
FROM orders
GROUP BY product_name
HAVING SUM(sales_amount) >= 10000000 AND COUNT(*) >= 20;

 

이제 HAVING 절이 어떤 식으로 응용되는지 조금 감이 오시죠? 😊

이런 기본 예제는 앞으로 이어질 실습에서도 꼭 필요하니까, 잘 익혀두세요!

 

 

4. 조건에 맞는 그룹만 필터링하기 🧐

이번에는 HAVING 절을 활용해서 특정 조건을 만족하는 그룹 데이터만 필터링하는 실전 예제를 알아볼게요.

이건 실무에서 굉장히 자주 쓰이는데,

예를 들어

고객별 총 주문 수, 지역별 총 매출, 회원 등급별 활동량 등을 비교할 때 유용하답니다.

👥 예제: 고객별 총 주문액이 50만 원 이상인 고객 조회

SELECT customer_id, SUM(order_amount) AS total_spent
FROM orders
GROUP BY customer_id
HAVING SUM(order_amount) >= 500000;

 

이 쿼리는 각 고객의 총 주문 금액을 계산한 뒤, 50만 원 이상 지출한 고객만을 결과로 보여줍니다.

이런 방식은 마케팅 대상 고객 선정, 리텐션 분석, VIP 고객 식별 등에 많이 활용돼요.

📌 WHERE와 HAVING 같이 써서 필터링 정교화하기

“최근 1년간 주문 중에서만 조건을 적용하고 싶다”는 상황이라면?

그럴 땐 WHERE 절로 먼저 기간 조건을 걸고, HAVING 절로 그룹 조건을 걸면 됩니다!

SELECT customer_id, SUM(order_amount) AS total_spent
FROM orders
WHERE order_date >= '2024-04-01'
GROUP BY customer_id
HAVING SUM(order_amount) >= 500000;

 

이렇게 하면 2024년 4월 이후 주문 중, 50만 원 이상 지출한 고객만 추출할 수 있어요.

데이터 전처리를 적절히 조합하면, HAVING 절은 정말 강력한 무기가 된답니다.

💡 다양한 조건 조합해보기

  • HAVING AVG(order_amount) BETWEEN 10000 AND 50000: 평균 주문금액 조건
  • HAVING COUNT(DISTINCT product_id) > 5: 다양한 상품 구매한 고객

실제 업무에 HAVING을 적용해보면, 고객 세분화나 리포트 필터링을 굉장히 유연하게 할 수 있다는 걸 느끼게 될 거예요. 정말 잘 쓰면 기초 SQL에서 한 단계 올라선 느낌! ✨

 

 

5. 매출이 높은 상위 카테고리 조회하기 💰

이번엔 실무에서 아주 자주 등장하는 쿼리 실습이에요.

바로 매출 기준으로 상위 카테고리만 필터링해서 조회하는 상황입니다.

BI 보고서, 마케팅 분석, 사업전략 수립 등 수많은 실전 업무에서 이 로직은 매일같이 쓰여요!

💼 실전 예제: 매출 상위 카테고리 3개만 조회

카테고리별 매출을 집계한 뒤, 상위 3개만 출력하는 쿼리입니다.

SELECT category, SUM(sales_amount) AS total_sales
FROM orders
GROUP BY category
ORDER BY total_sales DESC
LIMIT 3;

 

이 쿼리는 HAVING 절이 아닌 ORDER BY + LIMIT을 통해 상위 n개 그룹을 추출하는 방식이에요.

그럼 HAVING은 어떤 역할을 할까요?

🧾 조건부 상위 필터링 예제

이번엔 “매출이 1억 이상인 카테고리만 출력하자”는 조건을 추가해볼게요.

SELECT category, SUM(sales_amount) AS total_sales
FROM orders
GROUP BY category
HAVING SUM(sales_amount) >= 100000000
ORDER BY total_sales DESC;

 

여기서는 HAVING 절이 매출 기준 필터링 역할을 합니다.

ORDER BY는 정렬만 담당하고, WHERE로는 할 수 없었던 집계 조건은 HAVING이 처리하는 거예요.

💡 같이 쓰면 강력한 조합

  1. HAVING으로 조건을 먼저 거르고
  2. ORDER BY로 순서를 정렬하고
  3. LIMIT으로 상위 n개만 보여주기

이 3단계 조합은 정말 자주 쓰이고, 보고서 자동화나 Top N 분석에 탁월한 성능을 보여줘요.

 

 

6. 정리 🧠

지금까지 HAVING 절에 대해 기본 개념부터 실전 예제까지 다양하게 알아봤어요.

처음엔 WHERE와의 차이가 헷갈릴 수 있지만, 막상 한두 번 써보면 금방 익숙해지실 거예요.

HAVING은 단순한 문법이 아니라 집계된 데이터를 조건에 맞게 필터링함으로써 SQL을 좀 더 분석적으로 사용할 수 있도록 만들어주는 강력한 도구입니다.

 

실무에서는 이런 식으로도 자주 써요:

  • 고객별 구매 패턴 분석 (재구매 고객 필터링)
  • 상위 성과 지점/카테고리/부서 분석
  • 조건부 KPI 리포트 필터링

 

이제 HAVING 절이 단순한 집계 함수 뒤에 붙는 보조 옵션이 아니라, 데이터 분석을 훨씬 정교하게 만드는 핵심 문법이라는 점, 이해되셨죠?

꼭 직접 쿼리를 짜보며 익혀보세요!

 

반응형

+ Recent posts