반응형

파이썬 데이터베이스 프로그래밍 완전 입문
: NoSQL Cassandra와의 연동 방법

SQL만 알고 있다면 이제는 한 발 늦은 걸지도 몰라요. 초고속 분산형 NoSQL, Cassandra와 파이썬의 만남으로 새로운 데이터 처리의 지평을 열어보세요!

 

 

안녕하세요, 여러분!

오늘은 요즘 핫하게 떠오르는 NoSQL 데이터베이스 중 하나인 Apache Cassandra와 파이썬의 연동 방법에 대해 알아보려 해요.

대용량 데이터 처리에 특화된 이 데이터베이스는 대기업에서 실무에도 널리 사용되고 있을 정도로 강력한 성능을 자랑하죠.

SQL 기반 RDBMS에 익숙했던 분들이라면 처음에는 낯설 수 있지만, 이번 글을 통해 기초부터 천천히 배워보시면 분명 재미있고 유익할 거예요.

그럼 본격적으로 시작해볼까요?


1. Cassandra란 무엇인가요? 🧠

처음 듣는 분들도 계실 거예요. Apache Cassandra는 대규모 데이터를 분산하여 저장하고 처리하는 데 최적화된 NoSQL 데이터베이스입니다.

Facebook에서 시작되어 Apache 프로젝트로 발전했죠.

특히 읽기/쓰기 성능이 뛰어나고, 장애가 발생해도 안정적으로 동작하는 특성 덕분에 많은 대형 서비스에서 사용되고 있어요.

🧩 Cassandra의 핵심 특징

  • 분산형 구조: 모든 노드가 동등하게 작동하며, 특정 노드에 장애가 생겨도 데이터 손실 없이 운영 가능
  • 높은 쓰기 성능: 대량의 데이터를 빠르게 저장할 수 있어 로그 저장, IoT 등에도 적합
  • 무중단 확장: 데이터를 중단 없이 다른 서버로 확장 가능

📊 어떤 환경에서 Cassandra를 사용할까요?

대표적으로 실시간 분석, 추천 시스템, 이벤트 로그 저장, IoT 센서 데이터 저장 등에 자주 사용돼요.

Twitter, Netflix, Reddit, Spotify 같은 기업들도 Cassandra를 사용하고 있고요.

즉, 대용량의 데이터를 안정적이면서 빠르게 처리할 수 있어야 하는 서비스에 탁월하다는 이야기죠.

📝 관계형 데이터베이스와의 간단 비교

항목 관계형 DB Cassandra
데이터 구조 고정된 스키마 유연한 스키마 (컬럼 가변)
확장성 수직 확장 (성능 한계 존재) 수평 확장 (노드 추가만으로 성능 증가)
장애 허용 Master-Replica 구조 모든 노드가 Master 역할 수행

 

정리하자면,

Cassandra는 대규모 데이터를 빠르게 처리하고 안정적으로 저장할 수 있는 NoSQL DB로, 데이터 중심의 현대 서비스에서 점점 더 많은 관심을 받고 있어요.

만약 여러분이 지금 수많은 데이터를 다뤄야 한다면?

한번쯤 진지하게 Cassandra를 고려해볼 만하죠!

 

 

2. 왜 Cassandra인가요? 다른 NoSQL과의 비교 🔍

NoSQL이라는 단어, 이제는 제법 익숙해졌죠?

MongoDB, Redis, Couchbase, DynamoDB 등 다양한 NoSQL 데이터베이스가 있지만,

그중에서 왜 Cassandra를 선택해야 할까요?

그 이유를 데이터베이스의 성격과 특성으로 나눠 살펴볼게요.

⚔️ NoSQL 대표 주자들과 비교해보기

항목 MongoDB Redis Cassandra
데이터 구조 JSON 기반의 문서형 Key-Value 형식 Wide-Column (열 기반)
속도/성능 읽기 속도 우수 극단적 속도 (in-memory) 쓰기 성능 탁월
확장성 수평/수직 모두 가능 수직 확장 중심 완전한 수평 확장
가용성 Replica 기반 단일 노드 의존 모든 노드가 마스터

📍 Cassandra를 선택해야 할 상황은?

  • 전 세계 유저에게 빠르게 데이터를 제공해야 할 때 (지리적으로 분산된 서비스)
  • 계속해서 노드를 추가해야 할 때 (트래픽 증가, 서비스 확장 등)
  • 데이터 손실 없이 무중단 서비스를 원할 때 (고가용성 요구 상황)

결국 Cassandra는 확장성, 안정성, 대량 쓰기 성능이 필요한 서비스를 만들고자 할 때 최고의 선택이 될 수 있어요.

물론 MongoDB나 Redis가 더 잘 맞는 상황도 있겠지만, 트래픽이 빠르게 늘어나는 환경에서는 Cassandra의 가치가 빛을 발하죠.

 

💡 참고로 Cassandra는 AWS에서도 "Keyspaces"라는 이름으로 매니지드 서비스 형태로 제공되고 있으니,

      클라우드 기반 운영도 고려해볼 수 있어요.

 

 

3. Cassandra 개발환경과 파이썬 연동 준비하기 ⚙️

이번에는 본격적으로 개발 준비를 시작해볼게요.

Cassandra는 기본적으로 자바 기반의 서버로 동작하기 때문에,

JavaCassandra 설치, 그리고 파이썬에서 사용할 수 있는 드라이버를 함께 설치해야 해요.

🖥️ 1단계: Cassandra 설치하기 (로컬 or Docker)

  • 공식 홈페이지 설치: https://cassandra.apache.org 에서 최신 버전을 다운로드 후 설치 가능
  • Docker 이용: 아래 명령어로 빠르게 실행 가능
    docker run --name cassandra -p 9042:9042 -d cassandra:latest
        

🐍 2단계: 파이썬 드라이버 설치 (cassandra-driver)

파이썬에서 Cassandra에 접근하려면 cassandra-driver라는 전용 드라이버를 설치해야 해요.

pip로 간단히 설치할 수 있어요.

pip install cassandra-driver

 

❗ 설치 중 C++ 컴파일 환경이 없어서 오류가 날 수 있으니,

      윈도우라면 Visual C++ Build Tools, 리눅스라면 build-essential 설치가 필요할 수도 있어요.

🔗 3단계: Cassandra 접속 테스트

설치가 끝났다면, 아래 코드를 통해 파이썬에서 Cassandra 서버가 정상적으로 연결되는지 테스트해보세요!

from cassandra.cluster import Cluster

cluster = Cluster(['127.0.0.1'])  # 로컬 호스트 기준
session = cluster.connect()

print("Cassandra 연결 성공!")

 

이 메시지가 정상적으로 출력된다면 성공!

이제 Cassandra와 파이썬이 연결된 거예요.

 

다음 단계에서는 실제로 데이터를 저장하고 조회하는 CRUD 실습을 해볼 거예요. 👨‍💻

 

 

4. 파이썬으로 Cassandra 기본 연산(CRUD)하기 🛠️

이제 본격적으로 Cassandra에 데이터를 넣고, 수정하고, 조회하고, 삭제해보는 CRUD 실습을 해볼 시간입니다!

관계형 데이터베이스와 비슷한 듯하면서도 살짝 다른 Cassandra의 데이터 조작 방법을 익혀봅시다.

아래 예제들은 cassandra-driver를 통해 실행됩니다.

🔧 1. Keyspace와 테이블 생성

from cassandra.cluster import Cluster

cluster = Cluster(['127.0.0.1'])
session = cluster.connect()

# Keyspace 생성 (DB 역할)
session.execute("""
CREATE KEYSPACE IF NOT EXISTS test_keyspace
WITH replication = {'class': 'SimpleStrategy', 'replication_factor': '1'}
""")

# Keyspace 선택
session.set_keyspace('test_keyspace')

# 테이블 생성
session.execute("""
CREATE TABLE IF NOT EXISTS users (
    id UUID PRIMARY KEY,
    name text,
    age int
)
""")

 

Cassandra는 Keyspace를 데이터베이스처럼 사용하고, 내부에 테이블을 정의합니다.

UUID는 고유 식별자로 자주 쓰이는 자료형이에요.

➕ 2. 데이터 삽입 (INSERT)

import uuid

session.execute("""
INSERT INTO users (id, name, age) VALUES (%s, %s, %s)
""", (uuid.uuid4(), '홍길동', 29))

 

이렇게 간단하게 데이터를 넣을 수 있어요.

UUID는 uuid.uuid4()로 자동 생성할 수 있고, 문자열이나 숫자는 그대로 입력하면 됩니다.

🔍 3. 데이터 조회 (SELECT)

rows = session.execute('SELECT * FROM users')

for row in rows:
    print(row.id, row.name, row.age)

 

결과는 Row 객체로 반환되고, 반복문으로 출력할 수 있어요.

SQL처럼 SELECT * FROM 구문이 익숙하죠?

✏️ 4. 데이터 수정 (UPDATE)

# 예시용 id (실제로는 SELECT로 먼저 확인 필요)
user_id = uuid.UUID("e4c94406-48a1-4a2a-a423-5149a1e16899")

session.execute("""
UPDATE users SET age = %s WHERE id = %s
""", (30, user_id))

 

Cassandra는 WHERE 조건에서 Primary Key만 필터링 가능하다는 점, 꼭 기억하세요!

복잡한 조건은 허용되지 않아요.

🗑️ 5. 데이터 삭제 (DELETE)

session.execute("""
DELETE FROM users WHERE id = %s
""", (user_id,))

 

삭제도 마찬가지로 Primary Key를 기준으로 수행해야 해요.

정해진 조건 없이 DELETE를 사용하는 것은 Cassandra에서 제한적입니다.

📌 정리: Cassandra CRUD 한눈에 보기

작업 SQL 문법 Cassandra 문법
삽입 INSERT INTO ... 동일
조회 SELECT * FROM ... 동일 (단, 조건 제한)
수정 UPDATE ... WHERE ... Primary Key만 WHERE에 사용 가능
삭제 DELETE FROM ... Primary Key 기반만 가능

 

이제 여러분도 Cassandra에서 데이터를 다룰 수 있는 실력을 갖추게 되었어요!

 

다음 단계에서는 SQL과 CQL의 차이를 좀 더 깊이 비교해볼게요.

 

 

5. CQL과 SQL의 차이점과 실습 예제 비교 💡

처음 Cassandra를 접하면 "SQL이랑 거의 똑같네?" 싶은데요.

맞아요.

실제로 Cassandra는 CQL(Cassandra Query Language)이라는 SQL과 유사한 문법을 사용합니다.

하지만! 자세히 들여다보면 결정적인 차이점들이 존재합니다.

특히 관계형 DB에 익숙한 분들에게는 이 차이점이 실무에서 꽤 중요하게 작용하죠.

⚙️ SQL vs CQL 차이점 정리표

항목 SQL (RDBMS) CQL (Cassandra)
JOIN 자유롭게 사용 가능 지원하지 않음 (데이터 중복 허용)
GROUP BY / HAVING 지원 GROUP BY는 일부만 지원, HAVING은 지원 안됨
스키마 변경 제약조건 및 외래키 포함 관리 제약조건 없음, 유연한 컬럼 추가 가능
트랜잭션 ACID 보장 최소한의 트랜잭션 보장 (Eventually Consistent)
쿼리 최적화 서버가 최적화 개발자가 쿼리 설계를 직접 최적화

🧪 실습 예제로 비교해 보기

1️⃣ SQL에서 자주 쓰는 JOIN 쿼리

SELECT u.name, o.order_date
FROM users u
JOIN orders o ON u.id = o.user_id;

 

Cassandra에서는 이런 JOIN 쿼리는 불가능합니다.

그래서 데이터를 중복해서 저장하는 방식으로 해결해야 합니다.

이를 Denormalization(비정규화)라고 하죠.

2️⃣ Cassandra에서는 이렇게!

CREATE TABLE IF NOT EXISTS user_orders (
    user_id UUID,
    name text,
    order_id UUID,
    order_date timestamp,
    PRIMARY KEY (user_id, order_id)
);

 

JOIN 대신, 사용자 + 주문 정보를 하나의 테이블에 중복해서 저장해버리는 방식이에요.

이 덕분에 조회 성능은 훨씬 빨라지지만 유지보수에 유의해야 해요.

💡 핵심 요약

  • CQL은 SQL 문법과 매우 유사하지만 기능적인 제약이 있다.
  • Cassandra는 JOIN 없이도 성능을 유지하기 위해 구조 자체를 다르게 설계한다.
  • 확장성과 성능을 위해 데이터 중복을 감수하는 설계가 기본이다.

 

Cassandra는 전통적인 RDBMS와 완전히 다르게 접근해야 해요.

하지만 원리를 이해하고 나면, 오히려 대용량 시스템에 더 적합하다는 사실에 감탄하게 될 거예요.

 

 

6. 꼭 필요한 예제로 Cassandra 마스터하기 💪

지금까지 Cassandra의 개념과 파이썬 연동, CRUD, CQL 차이점까지 살펴봤죠.

이번에는 실제 서비스에 응용할 수 있는 실전 예제를 통해 정리해보겠습니다.

사용자별 주문 이력을 저장하고 조회하는 간단한 예제를 중심으로 Cassandra의 구조적 특징도 함께 익혀볼게요.

📦 사용자 주문 내역 저장 테이블 설계

CREATE TABLE IF NOT EXISTS user_orders (
    user_id UUID,
    order_id UUID,
    order_date timestamp,
    product_name text,
    quantity int,
    PRIMARY KEY (user_id, order_id)
);

 

이 테이블은 user_id 기준으로 파티셔닝되며, 한 사용자의 주문들이 order_id 순으로 정렬돼 저장돼요.

이렇게 하면 조회 성능이 매우 빠릅니다.

🛒 주문 추가 예제

from datetime import datetime
import uuid

user_id = uuid.uuid4()
order_id = uuid.uuid4()

session.execute("""
INSERT INTO user_orders (user_id, order_id, order_date, product_name, quantity)
VALUES (%s, %s, %s, %s, %s)
""", (user_id, order_id, datetime.utcnow(), '무선 이어폰', 2))

 

간단하죠? 필요한 데이터만 넣으면 끝입니다.

시간 저장 시 UTC 기준을 사용하는 게 좋습니다.

📋 주문 내역 조회 예제

rows = session.execute("""
SELECT order_id, order_date, product_name, quantity
FROM user_orders
WHERE user_id = %s
""", (user_id, ))

for row in rows:
    print(row.order_date, row.product_name, row.quantity)

 

user_id만 알면 해당 사용자의 모든 주문 내역을 빠르게 불러올 수 있어요.

Cassandra는 인덱스 없는 고속 조회를 위해 이렇게 설계합니다.

✅ 실전 활용 포인트

  • 파티션 키를 기준으로 테이블 설계해야 성능이 제대로 나와요.
  • JOIN, 서브쿼리, 복잡한 필터링은 Cassandra 스타일에 맞지 않아요. 설계에서 단순화가 필요해요.
  • 읽기 성능은 좋지만, 설계 실패 시 되돌리기 어려워요. 쿼리 우선 설계(Query-first modeling)가 기본입니다.

 

Cassandra는 단순한 구조와 높은 쓰기/읽기 성능이 핵심이지만, 그만큼 초기 설계의 중요성이 매우 커요.

예제 위주로 익히고, 실제 프로젝트에선 설계부터 철저히 접근하세요.

🎯 마무리하며

이번 글에서는 파이썬과 Cassandra 연동의 전 과정을 차근차근 살펴봤습니다.

기본 개념부터 CRUD, CQL 차이점, 실습 예제까지 하나하나 따라 하셨다면, 이제 Cassandra가 전혀 낯설지 않으실 거예요.

여러분의 데이터 처리 역량이 한 단계 업그레이드 되었기를 바랍니다!

반응형
반응형

파이썬 데이터베이스 프로그래밍 완전 입문: Redis와의 연동 방법

속도와 효율이 중요한 애플리케이션 개발자라면? 메모리 기반 데이터베이스 Redis를 파이썬과 함께 사용해보세요! ⚡️

 

 

안녕하세요, 여러분!  😊 

이번 글에서는 고성능의 인메모리 데이터 저장소인 Redis를 파이썬에서 어떻게 활용할 수 있는지 자세히 알아볼 거예요.

웹 개발, 캐싱 시스템, 실시간 분석 서비스까지 다양한 분야에서 사용되는 Redis는 데이터베이스 입문자부터 실무 개발자까지 꼭 익혀야 할 기술 중 하나랍니다.

파이썬에서는 redis 모듈을 통해 쉽게 Redis와 통신할 수 있는데요,

설치부터 기본 사용법, 주요 명령어, 예제 코드를 중심으로 아주 친절하게 설명드릴게요 😊

이제 Redis의 세계로 함께 떠나볼까요?

 

1. Redis란 무엇인가요? 🧠

Redis(REmote DIctionary Server)는 오픈 소스 기반의 인메모리 키-값 구조 데이터 저장소입니다.

일반적인 관계형 데이터베이스처럼 디스크 기반으로 저장되는 것이 아니라, 모든 데이터를 RAM에 저장하기 때문에 매우 빠른 읽기/쓰기 속도를 제공합니다.

이러한 특성 덕분에 캐시 시스템, 세션 저장소, 메시지 브로커 등 다양한 곳에서 Redis가 활용되고 있어요.

Redis의 주요 특징 🌟

  • 모든 데이터를 메모리(RAM)에 저장 → 빠른 속도 보장
  • 다양한 자료형 지원 (String, List, Set, Hash, Sorted Set 등)
  • TTL(Time-To-Live) 설정 가능 → 자동 만료 기능 제공
  • 퍼포먼스 향상 및 분산 처리 → 스케일 아웃 구조에 유리

Redis는 언제 사용하나요? 💡

단순히 데이터를 저장하는 것뿐만 아니라,

다음과 같은 상황에서 Redis가 강력한 효과를 발휘합니다:

적용 사례 설명
세션 관리 웹서버의 세션 데이터를 빠르게 저장/조회
캐시 시스템 자주 조회되는 데이터를 캐시로 저장하여 성능 향상
메시지 큐 Publish/Subscribe 방식으로 비동기 메시지 전달
실시간 분석 로그, 이벤트를 빠르게 수집하여 실시간 처리 가능

그렇다면 관계형 데이터베이스와는 어떻게 다를까요?

관계형 DB(MySQL, PostgreSQL 등)는 정형화된 스키마 기반 구조와 디스크 저장을 사용하지만,

Redis는 비정형 키-값 구조와 메모리 저장을 활용합니다.

복잡한 쿼리나 트랜잭션이 필요한 상황은 관계형 DB가 적합하지만,

속도가 중요하고 단순 데이터 저장이 필요한 경우 Redis가 탁월합니다.

 

정리하자면,

Redis는 빠른 속도가 필요한 실시간 시스템에서 강력한 성능을 보여주는 “고속 임시 데이터 저장소”입니다.

 

다음 장에서는 본격적으로 Redis를 파이썬에서 활용하기 위한 환경 설정 방법을 알아보겠습니다!

 

 

2. 파이썬에서 Redis 사용을 위한 환경 설정 ⚙️

파이썬에서 Redis를 사용하려면 가장 먼저 Redis 서버 설치파이썬용 클라이언트 모듈 설치가 필요해요.

Redis 서버는 로컬에 직접 설치할 수도 있고, Docker나 클라우드에서 구동할 수도 있습니다.

여기서는 가장 기본적인 방식인 로컬 설치와 PyPI 패키지를 사용하는 방법을 다룰게요.

1️⃣ Redis 서버 설치하기

운영체제에 따라 설치 방법이 조금씩 다릅니다.

아래에 각 환경별 대표 설치 명령어를 정리해볼게요.

운영체제 설치 명령어
Ubuntu (APT) sudo apt install redis-server
Mac (Homebrew) brew install redis
Windows WSL 또는 Redis 공식 배포 링크에서 zip 파일 다운로드

설치 후에는 redis-server 명령어로 Redis를 실행할 수 있어요.

기본 포트는 6379입니다.

2️⃣ 파이썬에서 redis-py 설치하기

Redis와 통신하기 위한 파이썬 모듈은 redis라는 이름으로 PyPI에 등록되어 있어요.

설치는 아주 간단합니다:

pip install redis

설치가 완료되면, 다음처럼 간단히 연결 테스트를 해볼 수 있어요.

import redis

r = redis.Redis(host='localhost', port=6379, db=0)
r.set('name', 'redis-test')
print(r.get('name'))

정상적으로 연결되면 출력 결과는 b'redis-test'처럼 바이트 형식으로 반환됩니다.

이 점도 실무에서 자주 마주치게 되는 포인트예요!

💡 Tip: 가상환경을 활용해보세요!

파이썬 프로젝트에서는 venvvirtualenv를 사용해서 프로젝트별 패키지 관리를 추천드려요.

패키지 충돌 없이 깔끔하게 Redis 환경을 구성할 수 있답니다.

이제 Redis 환경 구성이 끝났어요!

 

다음으로는 Redis의 핵심 명령어들을 직접 파이썬으로 다뤄보는 시간을 가질게요 😊

 

 

3. Redis의 핵심 명령어 살펴보기 🧾

Redis는 단순한 Key-Value 저장소를 넘어 여러 가지 자료형을 지원합니다.

그래서 상황에 따라 다양한 명령어를 사용할 수 있는데요.

여기서는 파이썬에서 자주 사용하는 문자열(String), 리스트(List), 해시(Hash) 관련 명령어를 소개할게요.

🔹 문자열(String) 명령어

r.set('name', 'Redis')        # 키에 문자열 저장
r.get('name')                 # 저장된 값 가져오기
r.incr('counter')             # 숫자 증가
r.decr('counter')             # 숫자 감소
  • 문자열은 기본 자료형으로, 가장 널리 사용돼요
  • 숫자를 저장하면 incr, decr 명령으로 카운터처럼 활용 가능

🔹 리스트(List) 명령어

r.rpush('queue', 'task1')     # 오른쪽에 추가
r.lpush('queue', 'task0')     # 왼쪽에 추가
r.lrange('queue', 0, -1)      # 전체 리스트 조회
r.lpop('queue')               # 왼쪽에서 꺼내기
  • ListQueueStack 구조로 활용 가능해요
  • FIFO나 LIFO 방식의 작업 큐 만들 때 유용해요

🔹 해시(Hash) 명령어

r.hset('user:1000', 'name', 'Alice')
r.hset('user:1000', 'email', 'alice@example.com')
r.hgetall('user:1000')
  • 해시는 하나의 키 안에 여러 필드를 저장할 수 있어요
  • 사용자 정보처럼 구조화된 데이터를 저장할 때 유용해요

⏱️ TTL (만료 시간) 설정도 가능!

r.setex('temp_key', 10, 'value')  # 10초 뒤 자동 삭제
r.expire('name', 30)              # 기존 키에 만료 시간 부여

이처럼 Redis는 단순한 저장을 넘어서 다양한 구조와 로직을 처리할 수 있는 기능들이 가득해요.

다음 Step에서는 이러한 명령어들을 조합해서 실전 예제를 함께 만들어볼 거예요 💡

 

 

4. 파이썬 Redis 예제 코드로 실습하기 💻

이제 Redis의 핵심 개념과 명령어는 어느 정도 익혔죠?

그럼 진짜 중요한 실습으로 넘어가 봐야겠죠 😎

파이썬과 Redis를 연동해 데이터를 저장하고 불러오는 실전 예제를 하나씩 만들어볼게요.

단순히 따라 치는 코드가 아니라, 실제 프로젝트에서 바로 써먹을 수 있는 코드 중심으로 정리했어요.

🔍 예제 1: 사용자 정보 저장하고 불러오기

사용자(user)의 이름, 이메일을 Redis의 Hash 형태로 저장해보고 다시 가져오는 예제예요.

import redis

r = redis.Redis(host='localhost', port=6379, db=0)

# 사용자 정보 저장
r.hset('user:1', mapping={'name': 'Alice', 'email': 'alice@example.com'})

# 사용자 정보 조회
user_info = r.hgetall('user:1')

# 디코딩 처리
for key, value in user_info.items():
    print(key.decode('utf-8'), ':', value.decode('utf-8'))

주의: Redis에서 데이터를 꺼내면 byte 타입으로 반환되기 때문에 decode('utf-8') 처리를 해주는 게 좋아요.

📦 예제 2: 간단한 캐시(Cache) 기능 구현

외부 API 호출 결과를 Redis에 저장하고 일정 시간 동안 캐싱하는 구조예요.

실제 웹 애플리케이션에서 자주 사용하는 방식이죠.

import redis
import time

r = redis.Redis()

def get_weather_data(city):
    # Redis에서 캐시된 데이터 확인
    if r.exists(city):
        print("🔁 Redis Cache hit")
        return r.get(city).decode('utf-8')
    
    # 캐시 없으면 외부 API 호출 대신 임시 데이터
    print("🌐 API 호출")
    weather = f"{city} 날씨: 맑음, 18도"
    
    # 캐시 저장 (60초 유효)
    r.setex(city, 60, weather)
    
    return weather

print(get_weather_data('Seoul'))
time.sleep(1)
print(get_weather_data('Seoul'))  # 캐시 hit
  • setex()로 TTL 설정 → 자동으로 캐시 만료
  • 캐시 유무에 따라 API 호출 여부 분기 처리

✨ 실전에서는 어떤 구조로 사용할 수 있을까?

Redis는 단일 키-값 저장소 이상의 능력을 갖고 있어요.

예를 들어,

쇼핑몰에서 "최근 본 상품 리스트"를 List로 구현하거나, 블로그 댓글을 Hash로 저장하고, 인기 게시물을 Sorted Set으로 관리하는 등 무궁무진한 응용이 가능합니다.

 

이제 다음 Step에서는 실제 서비스에서 사용되는 캐시 시스템을 Redis로 어떻게 구현하는지, 프로젝트 레벨의 예제를 통해 설명드릴게요 🧩

 

 

5. Redis를 활용한 캐시 시스템 구현 예시 📦

웹 애플리케이션에서 캐시는 속도 향상과 서버 부하 감소에 필수적인 요소입니다.

특히 데이터베이스 쿼리 비용이 높거나, 외부 API 호출이 빈번한 경우 캐시를 잘 구성하면 성능이 눈에 띄게 좋아집니다.

이번 섹션에서는 Redis를 활용해 실제처럼 DB 데이터를 캐시 처리하는 예제를 구현해볼 거예요.

💼 시나리오: 제품 상세 정보 캐시 처리

- 사용자가 특정 제품의 상세 정보를 조회할 때마다 DB에 접근하면 성능 저하가 발생합니다.
- 따라서 Redis에 캐시하고 일정 시간 동안은 캐시된 데이터를 활용해 효율을 높입니다.

🔧 예제 코드: DB → Redis 캐시 → 응답

import redis
import json
import time

# Redis 연결
r = redis.Redis()

# 임시 데이터베이스 (실제 DB 대체)
fake_db = {
    "p001": {"name": "USB 메모리", "price": 12000, "stock": 7},
    "p002": {"name": "무선 마우스", "price": 28000, "stock": 3},
}

def get_product(product_id):
    # Redis에서 캐시 확인
    if r.exists(product_id):
        print("🔁 캐시에서 조회")
        return json.loads(r.get(product_id))
    
    # DB에서 조회
    print("🌐 DB에서 조회")
    product = fake_db.get(product_id)
    if product:
        # Redis에 캐시 저장 (30초 동안 유지)
        r.setex(product_id, 30, json.dumps(product))
    
    return product

# 테스트
print(get_product("p001"))  # DB 조회
time.sleep(1)
print(get_product("p001"))  # 캐시 조회

📌 캐시 처리 시 고려할 점

  • 데이터가 자주 변경되는 경우 → TTL 설정을 짧게 하거나, 변경 시 강제 무효화
  • 로그인 사용자별 캐시 → user:123:cart처럼 키를 구체적으로 설정
  • 과도한 캐시로 메모리 초과 방지 → 주기적 삭제 정책 설정 필요

💡 실무 Tip

대형 서비스에서는 Redis를 단일 인스턴스로 사용하지 않고, 클러스터(Cluster) 구성으로 성능과 확장성을 확보합니다.

또한 LRU, LFU, TTL 등 다양한 캐시 만료 전략도 함께 사용되죠.

이처럼 Redis는 캐시 시스템에 있어서 빠르면서도 유연한 무기입니다.

잘만 활용하면 백엔드 성능을 비약적으로 높일 수 있어요!

 

마지막 단계에서는 Redis 사용 시 주의사항 및 추천 설정에 대해 정리해드릴게요.

지금까지 잘 따라오셨나요? 😊

 

 

6. Redis 활용 시 주의사항 및 마무리 팁 🎯

이제 Redis의 핵심 개념부터 파이썬 연동 실습, 캐시 시스템까지 한 번에 훑어봤어요.

실제 서비스에 Redis를 적용할 땐 단순히 “속도 빠르다!”만 믿고 쓰면 큰일 날 수 있어요.

그래서 마지막으로 꼭 기억해야 할 주의사항과 팁을 정리해드릴게요.

🚧 Redis 실전 사용 시 주의사항

  • 모든 데이터는 메모리에 올라감 → 메모리 용량 초과 주의!
  • 중요 데이터는 별도 저장 필수 → Redis는 비영구적 캐시에 적합
  • TTL 설정 안하면 캐시 누적 → 자동 만료 전략 적극 활용
  • 보안 설정 꼭 하기 → password 설정 및 방화벽 제한 필요

🎁 마무리하며

Redis는 빠르고 간단하지만 유연한 데이터 저장소입니다.

파이썬과의 궁합도 좋아서 백엔드 개발자라면 반드시 다뤄봐야 할 도구예요.

캐시, 세션, 작업 큐, 실시간 데이터 저장 등 활용 범위도 무궁무진하죠.

이번 글에서 소개한 예제와 팁들을 바탕으로, 직접 Redis 프로젝트에 도전해보시길 추천드려요! 🙌

 

 

반응형
반응형

파이썬 데이터베이스 프로그래밍 완전 입문
: NoSQL MongoDB와 PyMongo 연동하기

관계형 DB만 고집하다가 MongoDB를 접하고 세계가 확장된 느낌,
혹시 여러분도 그런 순간을 맞이하고 싶으신가요?

 

 

안녕하세요, 개발자 여러분!

오늘은 파이썬과 함께 MongoDB라는 NoSQL 데이터베이스를 다뤄볼 거예요.

SQL 쿼리 대신 JSON 스타일 문법으로 데이터를 다루고, 유연한 스키마 구조 덕분에 빠르게 개발할 수 있다는 점에서 MongoDB는 현대 애플리케이션에 꼭 필요한 기술 중 하나죠.

특히 초보자라면 처음엔 다소 생소할 수 있지만, PyMongo 라이브러리를 활용하면 파이썬으로도 손쉽게 MongoDB와 연동하여 데이터를 삽입하고 조회하는 실습이 가능합니다.

이 블로그에서는 MongoDB의 기초 개념부터 PyMongo를 이용한 실습까지 차근차근 따라가 보도록 할게요.

지금부터 함께 MongoDB의 매력에 빠져봅시다!

 

1. MongoDB란 무엇인가요? 🧠

MongoDB는 대표적인 NoSQL 데이터베이스 시스템이에요.

전통적인 관계형 데이터베이스와는 달리, 테이블과 행(row) 개념 없이 문서(document) 단위로 데이터를 저장합니다.

이 문서는 JSON 형식으로 표현되고, 내부적으로는 BSON(Binary JSON)으로 처리돼요.

쉽게 말하면, MongoDB는 정형화된 스키마 없이 자유롭게 데이터를 넣을 수 있는 데이터베이스예요.

개발 속도가 빠르고 유연하며, 대량의 데이터를 효율적으로 처리할 수 있어서 스타트업부터 대기업까지 다양한 서비스에서 널리 사용되고 있어요.

MongoDB의 핵심 특징은?

  • 문서 기반(Document-Oriented): JSON 형태로 데이터 저장, 유연한 구조
  • 스키마 유연성(Schema-less): 다양한 형식의 데이터를 하나의 컬렉션에 저장 가능
  • 수평 확장성(Scalability): 샤딩(Sharding) 기능을 통해 대규모 분산 저장 지원
  • 고가용성(High Availability): Replica Set을 통한 자동 장애 조치(Failover)

MongoDB를 사용하는 이유는 뭘까요?

특징 이점
스키마 없는 구조 빠른 개발 가능, 데이터 구조 변경 용이
JSON 문서 기반 프론트엔드와의 자연스러운 연동
수평적 확장성 대용량 서비스에 적합
다양한 언어 지원 Python, Java, Node.js 등과 연동 쉬움

 

MongoDB는 단순한 데이터 저장을 넘어서 대규모 애플리케이션의 핵심 데이터 처리 플랫폼으로 자리 잡고 있어요.

특히 실시간 데이터 처리, 비정형 로그 수집, 사용자 맞춤형 데이터 저장 등 다양한 분야에서 유용하게 쓰이고 있죠.

다음 섹션에서는 MongoDB의 구조와 개념을 RDBMS와 비교해 보면서 더 깊이 이해해 볼게요.

NoSQL과 SQL, 뭐가 다를까요?

 

 

2. NoSQL과 RDBMS의 차이점 🔍

많은 분들이 MongoDB 같은 NoSQL을 처음 접할 때 이런 질문을 하곤 해요.

"SQL이랑 뭐가 다르지?" 사실 이건 아주 좋은 질문이에요.

두 기술은 서로 다른 목적과 철학을 갖고 있고, 사용하는 방식도 꽤나 다르거든요.

SQL vs NoSQL, 구조부터 다르다!

항목 RDBMS (SQL) NoSQL (MongoDB)
데이터 구조 테이블 기반 (행과 열) 문서 기반 (JSON/BSON)
스키마 고정된 스키마 필요 유연한 스키마 (동적)
확장성 수직 확장 (서버 업그레이드) 수평 확장 (서버 추가)
트랜잭션 ACID 보장 기본적으로 약한 일관성, 필요 시 트랜잭션 가능
사용 예시 은행, 회계 등 정형 데이터 SNS, 로그, 사용자 프로필 등

그럼 MongoDB는 언제 쓰는 게 좋을까요?

  • 빠르게 데이터 구조가 변하는 서비스 → SNS, 스타트업 MVP
  • 복잡한 관계보다 개별 문서 위주의 저장 → 사용자 정보, 로그 데이터
  • 데이터 수집, 분석 기반의 시스템 → IoT, 실시간 데이터 처리

요약하자면, 관계형 DB는 엄격함과 정형화에 강하고, MongoDB는 유연함과 확장성에서 강점을 갖고 있어요.

상황에 따라 적절한 선택이 중요하겠죠?

이제 MongoDB에 대해 어느 정도 감이 잡히셨나요?

다음 단계에서는 실제로 MongoDB를 설치하고 실행해 보면서 실습을 시작해 볼게요! 😊

 

 

3. MongoDB 설치 및 기본 설정 🛠️

이제 MongoDB에 대해 기본적인 개념을 익혔다면, 직접 설치해보면서 실습해볼 차례입니다.

MongoDB는 윈도우, macOS, 리눅스 모두 지원하며, 설치도 생각보다 간단해요!

이번에는 가장 많이 사용되는 Windows 기준 설치 방법MongoDB Compass 설정까지 함께 알아볼게요.

1️⃣ MongoDB Community 버전 설치

  1. 공식 사이트(https://www.mongodb.com)에 접속하여 설치 파일을 다운로드
  2. 설치 파일 실행 후, 설치 옵션은 기본값으로 두고 설치 진행
  3. "Install MongoDB Compass" 옵션 체크 후 설치 완료

설치가 완료되면 MongoDB 서버가 자동으로 실행되고, 컴퓨터를 켤 때마다 자동 시작되도록 설정돼요. mongod 명령어로 서버를 실행할 수 있고, mongo 명령어로 셸을 사용할 수 있어요.

2️⃣ MongoDB Compass 설치 및 실행

  • GUI 기반 MongoDB 관리 도구
  • 로컬 MongoDB 서버 주소: mongodb://localhost:27017 입력
  • 연결 후 데이터베이스 생성 및 컬렉션 생성 가능

3️⃣ 기본 설정 및 확인

MongoDB 설치 후,

정상적으로 실행 중인지 확인하려면 터미널(명령 프롬프트)에서 아래 명령어를 사용해보세요.

mongod --version
mongo --eval "db.stats()"

 

이제 MongoDB 서버와 GUI 툴까지 설치가 끝났다면, 다음 단계에서는 파이썬에서 MongoDB와 연결하는 방법,

PyMongo 연동을 알아볼 차례예요!

 

 

4. PyMongo를 이용한 MongoDB 연결 방법 🔌

드디어 파이썬에서 MongoDB에 연결해 볼 시간입니다! 우리는 PyMongo라는 공식 라이브러리를 통해 손쉽게 MongoDB와 파이썬 간의 통신을 할 수 있어요. 이제부터는 코드를 통해 MongoDB의 세계에 진입해 봅시다 😎

1️⃣ PyMongo 설치

PyMongo는 pip 명령어로 간단히 설치할 수 있습니다.

pip install pymongo

2️⃣ 기본 연결 코드

MongoDB 서버가 로컬에서 실행 중이라면, 기본 주소는 mongodb://localhost:27017입니다.

다음은 PyMongo로 MongoDB에 연결하고, 데이터베이스와 컬렉션을 선택하는 코드입니다.

from pymongo import MongoClient

# 클라이언트 생성 및 로컬 MongoDB 연결
client = MongoClient("mongodb://localhost:27017")

# 'testdb'라는 데이터베이스 선택 (없으면 생성됨)
db = client['testdb']

# 'users'라는 컬렉션 선택 (없으면 생성됨)
collection = db['users']

print("MongoDB 연결 성공!")

 

위 코드를 실행하면 MongoDB에 연결되어 testdb 데이터베이스와 users 컬렉션에 접근할 수 있게 돼요.

3️⃣ MongoDB에 샘플 데이터 삽입하기

이번엔 테스트용 데이터를 하나 삽입해 봅시다.

문서는 JSON 형태로 파이썬의 딕셔너리처럼 작성해요.

# 사용자 정보 삽입
doc = {"name": "Alice", "age": 25, "email": "alice@example.com"}
collection.insert_one(doc)

print("데이터 삽입 완료!")

4️⃣ 연결 확인 팁

  • Compass에서 확인하기: 데이터베이스 목록에 testdb가 생겼는지 확인
  • 터미널에서 확인: mongo 셸로 접속 후 use testdb, db.users.find()

PyMongo로 연결을 성공했다면 이제 본격적으로 CRUD(Create, Read, Update, Delete) 연산을 실습해볼 준비가 된 거예요!

다음 섹션에서는 MongoDB에 데이터를 저장하고 수정하고 삭제하는 등 다양한 동작을 실습해볼게요!

 

 

5. MongoDB CRUD 실습 예제 💾

이제 본격적으로 MongoDB의 핵심 기능인 CRUD(Create, Read, Update, Delete) 연산을 실습해볼 시간입니다.

이 부분이 바로 실전에서 가장 자주 사용되고 중요한 부분이에요.

하나씩 차근차근 해볼게요. 🔍

1️⃣ Create - 문서 삽입

# 단일 문서 삽입
collection.insert_one({"name": "Bob", "age": 30, "email": "bob@example.com"})

# 여러 문서 한꺼번에 삽입
collection.insert_many([
    {"name": "Charlie", "age": 35},
    {"name": "Diana", "age": 28, "email": "diana@example.com"}
])

2️⃣ Read - 문서 조회

# 전체 조회
for doc in collection.find():
    print(doc)

# 조건부 조회
user = collection.find_one({"name": "Bob"})
print(user)

3️⃣ Update - 문서 수정

# 하나만 수정
collection.update_one(
    {"name": "Bob"},
    {"$set": {"age": 31}}
)

# 여러 개 수정
collection.update_many(
    {"age": {"$gt": 30}},
    {"$set": {"senior": True}}
)

4️⃣ Delete - 문서 삭제

# 하나만 삭제
collection.delete_one({"name": "Charlie"})

# 여러 개 삭제
collection.delete_many({"senior": True})

CRUD 요약

연산 함수 설명
Create insert_one(), insert_many() 문서 삽입
Read find(), find_one() 문서 조회
Update update_one(), update_many() 문서 수정
Delete delete_one(), delete_many() 문서 삭제

 

이제 MongoDB에서 가장 핵심적인 데이터 조작 기능들을 직접 해보셨어요!

직접 데이터를 넣고 바꾸고 지워보는 이 연습은 MongoDB와 친해지는데 정말 효과적입니다.

다음 단계에서는 실제 프로젝트에서 MongoDB를 어떻게 쓸 수 있을지, 팁과 함께 정리해볼게요!

 

 

MongoDB 입문을 성공적으로 마쳤다면? 🧩 

여기까지 따라오셨다면 이제 여러분은 NoSQL의 세계로 무사 입문 완료!

MongoDB는 단순한 실습을 넘어서, 실제 웹 애플리케이션이나 AI 백엔드, 로그 분석 시스템, 데이터 수집 파이프라인 등 다양한 분야에서 실전 도구로 사용됩니다.

오늘 배운 내용을 바탕으로 여러분만의 프로젝트에 MongoDB를 직접 적용해보면, 정말 빠르게 성장하고 있다는 걸 느끼게 될 거예요.

 

다음 단계로는 MongoDB Atlas를 이용해 클라우드 환경에서 MongoDB를 다뤄보거나, Flask나 FastAPI와 함께 백엔드 프로젝트를 연결해보는 것도 추천드려요!

이제 여러분은 MongoDB와 PyMongo라는 든든한 무기를 손에 넣었으니, 다양한 데이터 기반 애플리케이션 개발에 도전해보세요!

 

읽어주셔서 감사합니다 🙌

질문이나 의견은 댓글로 남겨주시고, 도움이 되셨다면 공유도 부탁드려요!

반응형

+ Recent posts