기초

네트워크 프로토콜 (IP, DNS, HTTP, TCP, UDP)

IP (Internet Protocol): 인터넷 상에서 모든 데이터 패킷의 송수신을 관리합니다.
DNS (Domain Name System): 도메인 이름을 IP 주소로 변환하여 브라우저가 인터넷 자원을 로드할 수 있습니다.
HTTP (HyperText Transfer Protocol): 인터넷 상에서 웹 페이지를 전송하는 데 사용되는 프로토콜입니다.
TCP (Transmission Control Protocol): 데이터를 신뢰성 있게, 순서대로, 오류를 확인하여 전달합니다.
UDP (User Datagram Protocol): 동영상 재생이나 DNS 조회와 같이 시간에 민감한 전송에 사용됩니다.

저장, 지연 및 처리량

지연 시간: 시스템에서 경험하는 시간 지연, 데이터가 한 지점에서 다른 지점으로 이동하는 데 걸리는 시간입니다.
처리량: 주어진 기간 내 시스템에서 처리되는 데이터의 양을 나타내며, 시스템의 용량을 나타냅니다.

폴링, 스트리밍, 소켓

폴링: 입력 장치의 상태를 지속적으로 확인하는 것입니다.
스트리밍: 주로 오디오 또는 비디오 데이터의 연속 전송입니다.
소켓: 네트워크를 통해 데이터를 송수신하기 위한 엔드포인트입니다.

데이터베이스

SQL vs NoSQL

SQL: ACID 준수와 같은 구조화된 데이터에 사용됩니다. MySQL, Oracle, SQL Server 및 PostgreSQL 등이 있습니다.
NoSQL: 구조화되지 않거나 반구조화된 데이터에 사용됩니다. 예시로는 MongoDB (문서 기반)와 Cassandra (열 기반) 등이 있습니다.

어떤 것을 사용해야 할까요:

ACID를 필요로 하는 구조화된 데이터: MySQL, Oracle, SQL Server 및 PostgreSQL과 같은 SQL 데이터베이스를 사용하세요.
ACID 없이 데이터 유형과 쿼리: MongoDB나 CouchBase와 같은 문서 DB를 사용하세요.
유한한 쿼리를 포함하는 대용량 데이터: Cassandra와 HBase와 같은 열 지향 DB를 사용하세요.

ACID 속성

원자성은 모든 트랜잭션이 완전히 성공하거나 실패해야 한다는 것을 의미합니다. 시스템 실패의 경우라도 부분적으로 완료될 수 없습니다.
일관성은 각 단계에서 데이터베이스가 불변식을 따르는 것을 의미합니다: 유효성을 검증하고 손상을 예방하는 규칙입니다.
고립성은 동시에 실행되는 트랜잭션이 서로에게 영향을 미치지 못하도록 합니다. 트랜잭션은 병렬로 실행되더라도 순차적으로 실행된 것과 같은 최종 상태로 결과를 내야 합니다.
지속성은 트랜잭션을 최종적으로 만듭니다. 심지어 시스템 실패도 성공적인 트랜잭션의 효과를 롤백할 수 없습니다.

인덱스

데이터 검색 속도를 높이지만 추가 저장 공간 및 유지보수 오버헤드가 필요합니다.

주요 사항:

더 빠른 검색을 위해 특정 열이 있는 테이블의 재료 복사본.
저장 공간과 쿼리 시간 사이의 절충안.
모든 사용된 열에 적합한 인덱싱을 통해 전체 테이블 스캔을 피함.
누락된 및 사용되지 않는 인덱스를 최적화해야 함.
PostgreSQL 인덱스는 테이블 스캔을 가속화하기 위해 행 식별자/주소를 저장함.

조인

Inner Join: 두 테이블 모두에서 일치하는 값을 가진 행을 반환.
Left Outer Join: 왼쪽 테이블의 모든 행과 오른쪽 테이블에서 일치하는 행을 반환.
Right Outer Join: 오른쪽 테이블의 모든 행과 왼쪽 테이블에서 일치하는 행을 반환.
Full Join: 두 테이블 중 하나에서 일치하는 경우 모든 행을 반환.

최적의 방법:

긴 쿼리 대신 뷰와 저장 프로시저를 사용하세요.
트리거 대신 제약 조건을 사용하세요.
성능을 더 높이기 위해 UNION 대신 UNION ALL을 사용하세요.

데이터 분할

테이블이나 데이터베이스 간에 데이터를 나누는 것을 말합니다.

수평 분할 (Sharding): 샤드 키를 사용하여 데이터를 여러 데이터베이스에 나누는 것입니다.
수직 분할: 테이블을 작은 구분된 부분으로 분할하는 것입니다.

샤딩(Sharding)

데이터베이스를 샤딩하는 것은 서버측 시스템을 설계할 때 사용되는 일반적인 확장성 전략입니다. 서버측 시스템 아키텍처는 시스템을 더 확장 가능하고 신뢰할 수 있으며 성능이 우수하도록 만들기 위해 샤딩과 같은 개념을 사용합니다. 샤딩은 샤드 키에 따라 데이터를 수평으로 분할하는 것입니다. 이 샤드 키는 영속화해야 하는 항목을 보낼 데이터베이스를 결정합니다. 이를 위한 일반적인 전략 중 일부는 리버스 프록시입니다.

데이터 복제 전략

여러 기기 간에 데이터를 복사하여 가용성과 신뢰성을 보장합니다.

동기 복제: 기본 및 보조 서버에 동시에 쓰기가 발생합니다.
비동기 복제: 먼저 기본 서버에 쓰기가 발생하고 그 후에 보조 서버로 전파됩니다.

CAP 이론

"CAP" 이론은 분산 데이터베이스에서 한 번에 두 가지 속성만을 보장할 수 있다고 말합니다.

일관성: 모든 노드가 동시에 동일한 데이터를 볼 수 있습니다.

가용성: 모든 요청에 응답이 옵니다.

분할 허용성: 네트워크 분할이 발생해도 시스템이 작동합니다.

CA (일관성과 가용성): SQL 데이터베이스.

CP (일관성과 분할 내구성): DocumentDB.

AP (가용성과 분할 내구성): ColumnarDB.

최종 일관성

충분한 시간이 지나면 모든 복제본이 동일한 상태로 수렴되도록 보장하여 분산 시스템에서 높은 가용성을 달성하는 데 사용됩니다.

GraphQL

API를 위한 쿼리 언어로, REST에 대안으로 더 효율적이고 강력하며 유연한 기능을 제공합니다.

Map Reduce

대규모 데이터 집합을 처리하기 위한 프로그래밍 모델로, 클러스터 상에서 분산 알고리즘으로 작동합니다.

캐싱, LRU 캐시

캐싱: 데이터를 임시로 저장하여 후속 액세스를 빠르게 합니다.
LRU 캐시: 최근에 사용되지 않은 항목을 먼저 제거하는 가장 최근에 사용된 캐시 방침입니다.

분산 시스템에서의 캐싱:

목적: 성능 및 확장성 향상.
주요 특징: 높은 캐시 히트 비율, 낮은 메모리 풋프린트.
제거 방침: LRU, FIFO, 슬라이딩 윈도우.
쓰기 방침: 쓰기 스루 (캐시 및 백업 저장소에 즉시 쓰기) 및 쓰기 백 (먼저 캐시에 쓰고 나중에 백업 저장소에 씁니다).
구현: 빠른 조회를 위해 HashMap 또는 HashTable 사용, 마지막 항목 제거를 위해 이진 검색 트리 또는 배열 사용, 빠른 head/tail 액세스를 위해 이중 연결 리스트 사용.
배치: 서버나 데이터베이스에 가까운 위치에 배치하며, 데이터베이스에 가까운 옵션으로 지속적인 저장소인 Redis를 사용합니다.

분산 트랜잭션, 2PC 및 Sage

분산 트랜잭션: 여러 노드 또는 데이터베이스에 걸친 트랜잭션입니다.
2PC(2단계 커밋): 모든 노드가 트랜잭션을 조정된 방식으로 커밋 또는 롤백하도록 보장합니다.
Sage 패턴: 각각의 트랜잭션이 단일 서비스 내의 데이터를 업데이트하는 지역 트랜잭션의 일련의 패턴입니다.

성능 튜닝

쿼리 최적화, 인덱싱 및 캐싱 전략을 포함하여 시스템 성능을 최적화하기 위해 구성 및 코드를 조정하는 작업입니다.

배포

가용성 및 확장성

가용성: 시스템이 필요할 때 운영 및 접근 가능한 정도입니다.

확장성: 더 많은 리소스를 추가하여 시스템 용량을 증가시키는 것(수평 확장) 또는 기존 리소스를 강화하는 것(수직 확장)입니다.

로드 밸런싱

여러 서버 사이에 들어오는 네트워크 트래픽을 분산하여 어느 한 서버도 과부하가 걸리지 않도록 하는 작업.

API 게이트웨이

요청 처리, 라우팅, 결합 및 변환을 담당하는 API 프론트엔드로 작동하는 서버.

프록시

클라이언트로부터 서버로 요청을 전달하는 중개자로, 종종 로드 밸런싱 및 캐싱에 사용됩니다.

서버 선택 전략

요청에 대한 최적의 서버를 선택하는 방법으로, 라운드로빈, 최소 연결 또는 리소스 기반 선택과 같은 방법이 있습니다.

일관된 해싱

클러스터 간 데이터를 분산시키는 방법으로, 노드가 추가되거나 제거될 때 재구성을 최소화합니다.

표준 해싱: 객체를 검색 공간으로 매핑하고, 해당 컴퓨터로 부하를 전달합니다.
일관된 해싱: 서버를 키 공간에 매핑하고, 다음 시계방향 서버로 요청을 할당하여 유연성과 확장성을 제공합니다.

VMs 및 Dockers/컨테이너

가상 머신 (Virtual Machines): 완전한 운영 체제를 갖춘 물리적 컴퓨터를 모방합니다.
컨테이너 (Docker): 가볍고 휴대 가능하며 소프트웨어와 해당 의존성을 포장하는 자체 포괄적 단위입니다.

쿠버네티스, 인그레스, 라이브니스 및 레디니스 프로브

쿠버네티스: 컨테이너화된 응용 프로그램의 배포, 확장 및 관리를 자동화하는 오케스트레이션 도구입니다.
인그레스: 쿠버네티스 클러스터에서 서비스에 대한 외부 액세스를 관리합니다.
라이브니스 프로브: 응용 프로그램이 실행 중인지 확인합니다.
레디니스 프로브: 응용 프로그램이 트래픽을 수용할 준비가 되었는지 확인합니다.

리더 선출

분산된 프로세스나 시스템 사이에서 리더를 선택하는 과정으로, 작업을 조정합니다.

카나리아 배포

카나리아 배포: 잠재적 문제의 영향을 최소화하기 위해 작은 일부 사용자에게 변경 사항을 배포하는 것입니다.

통합

메시징 시스템 (Point to point, Pub-Sub)

Point to Point: 두 시스템 간의 직접 통신.
Pub-Sub (Publish-Subscribe): 메시지는 주제에 발행되며 구독자는 해당 주제에서 메시지를 수신합니다.

메시지 직렬화

메시지를 네트워크로 전송할 수 있는 형식으로 변환하고 나중에 재구성하는 과정입니다.

Redis vs Kafka vs RabbitMQ

Redis: 인메모리 데이터 구조 저장소로 데이터베이스, 캐시 및 메시지 브로커로 사용됩니다.
Kafka: 분산 스트리밍 플랫폼으로, 실시간 데이터 파이프라인 및 스트리밍 애플리케이션을 구축하는 데 사용됩니다.
RabbitMQ: AMQP(고급 메시지 큐잉 프로토콜)를 구현한 메시지 브로커입니다.

API 아키텍처

API의 구조 및 디자인, 버전 관리, 인증 및 요청 제한과 같은 모베스트 프랙티스를 포함합니다.

API에 대한 최상의 실천 방법:

해독이 쉬운 JSON을 사용하고 XML보다 선호합니다.
리소스에는 명사를, HTTP 메서드에는 동사를 사용합니다 (GET, PUT, PATCH, DELETE).
오류 처리에는 HTTP 상태 코드를 활용합니다.
버전 관리를 구현합니다.
페이로드 크기를 줄이고 제한합니다.
캐싱을 활성화합니다.
충분한 네트워크 속도를 보장합니다.
과도한 요청을 제어하기 위해 요율 제한을 사용합니다.
데이터 전송을 최소화하기 위해 업데이트에는 PUT보다는 PATCH를 선호합니다.
/health 및 /metrics와 같은 미리 정의된 엔드포인트와 로깅, 모니터링을 활성화합니다.

REST(Representational State Transfer)는 HTTP 메서드를 사용하여 네트워크 애플리케이션을 디자인하는 아키텍처 스타일입니다. SOAP(Simple Object Access Protocol)은 XML을 사용하여 웹 서비스에서 구조화된 정보를 교환하는 데 사용됩니다. gRPC는 RPC(Remote Procedure Calls)를 위한 고성능 오픈소스 프레임워크입니다.

회로 차단기, 오류 복구

서킷 브레이커: 장애를 감지하고 유지 보수 중에 계속해서 발생하는 장애를 방지하는 논리를 캡슐화하는 데 사용되는 디자인 패턴입니다.

보안

TLS, SSL, HTTPS 프로토콜

TLS (전송 계층 보안): 컴퓨터 네트워크 상의 통신을 보호하는 프로토콜입니다.
SSL (보안 소켓 레이어): TLS의 전신으로 암호화된 통신을 제공합니다.
HTTPS (HTTP Secure): TLS 암호화가 적용된 HTTP입니다.

핸드셰이킹

핸드셰이킹: 두 개체 간의 협상 및 통신 매개변수 설정 과정입니다.

인증 및 권한 부여

인증: 사용자 또는 시스템의 신원을 확인하는 과정입니다.
권한 부여: 인증된 사용자 또는 시스템에 부여된 권한을 결정하는 과정입니다.

암호화

데이터를 인코딩하여 무단 액세스를 방지하는 과정.

JWT

JWT (JSON Web Token): 두 당사자 간에 전송될 클레임을 나타내는 간소하고 URL 안전한 방법.

OAuth

OAuth는 토큰 기반 인증에 일반적으로 사용되는 액세스 위임을 위한 오픈 표준입니다.

ELK Stack & Monitoring

Elasticsearch, Logstash, 그리고 Kibana는 실시간으로 로그 데이터를 검색, 분석, 시각화하기 위해 사용됩니다.

OWASP Framework

OWASP (Open Web Application Security Project): 소프트웨어 보안을 개선하기 위한 프레임워크입니다.

디자인 패턴

생성, 구조 및 행위

Creational Patterns: 객체 생성 메커니즘을 다룹니다. 예: 싱글톤, 팩토리.
Structural Patterns: 객체 구성을 다룹니다. 예: 어댑터, 컴포지트.
Behavioral Patterns: 객체 상호작용과 책임을 다룹니다. 예: 옵서버, 전략.

싱글톤 패턴

클래스가 단 하나의 인스턴스만 가지도록 보장하고 그 인스턴스에 대한 전역 접근 지점을 제공합니다.

팩토리 패턴

객체를 생성할 때 인스턴스화 논리를 클라이언트에 노출시키지 않습니다.

옵저버 패턴

객체 간에 일대다 종속성을 정의하여 하나의 객체가 상태를 변경할 때 모든 종속 객체가 알림을 받습니다.

데코레이터 패턴

객체에 새로운 기능을 동적으로 추가합니다.

발행-구독 모델

발행자는 메시지를 주제에 보내고, 구독자는 주제로부터 메시지를 수신합니다.

이벤트 버스 패턴

어플리케이션의 서로 다른 부분이 이벤트를 방송하여 서로 통신할 수 있는 구조 패턴입니다.

아키텍처

SOLID 원칙

단일 책임 원칙: 한 클래스는 변경될 이유가 하나여야 합니다.
개방 폐쇄 원칙: 소프트웨어 요소는 확장에 대해서는 열려 있어야 하지만 수정에 대해서는 닫혀 있어야 합니다.
리스코프 치환 원칙: 서브 타입은 기본 타입으로 대체 가능해야 합니다.
인터페이스 분리 원칙: 클라이언트는 사용하지 않는 메서드에 의존하도록 강제해서는 안 됩니다.
의존 역전 원칙: 구상이 아닌 추상에 의존해야 합니다.

12 Factor App

웹 서비스 앱을 만들기 위한 방법론으로, 명시적 포맷, OS와의 깔끔한 계약, 그리고 지속적인 배포를 강조합니다.

Tiered, Layered & SOA Architecture

Tiered Architecture: 애플리케이션을 프리젠테이션, 비즈니스, 데이터 레이어 등 논리적 계층으로 분리합니다.
Layered Architecture: Tiered와 유사하지만 더 분산된 구조입니다.
SOA (Service-Oriented Architecture): 서비스가 독립적으로 원격으로 액세스할 수 있는 기능 단위를 제공하는 디자인 스타일입니다.

마이크로서비스 및 안티패턴

마이크로서비스 아키텍처: 비즈니스 도메인 주변에 모델링된 작은 자율 서비스 모음으로 응용 프로그램을 구축하는 것.

안티패턴: 공통이지만 비효율적 또는 역생산적인 관행, 예를 들어 공유 데이터베이스, 잘못된 서비스 경계.

자바 메모리

애플리케이션 전체에서 Java Heap Space를 사용합니다. 이는 객체를 할당하기 위한 대량의 메모리입니다. -Xms, -Xmx를 사용하여 최소 및 최대값을 조정할 수 있습니다.
Stack은 현재 실행 중인 메서드, 힙 내 객체에 대한 참조, 로컬 변수에만 사용됩니다. 스레드 당 스택이 생성됩니다. Java에서의 스택 메모리는 정적 메모리 할당 및 스레드 실행에 사용됩니다. -Xss를 사용하여 튜닝할 수 있습니다. 만약 StackOverflow 오류가 발생하면 조정하는데 사용됩니다.
PermGen은 메타데이터 공간 또는 메서드 영역입니다. PermGenSpace에서 OutOfMemoryError가 발생하며 기본적으로 64MB가 할당되며 -XX:MaxPermSize를 튜닝할 수 있습니다. Java 8에서는 metaspace로 불리며 모든 메모리를 점유할 수 있습니다.
Java 런타임을 가져오세요: Runtime runtime = Runtime.getRuntime()

Java 기본

상속, 다형성, 캡슐화 및 추상화: 핵심 OOP 원칙들입니다.
Final 키워드: 변수, 메서드 및 클래스의 변경을 방지합니다.
Static 키워드: 모든 객체에 의해 공유되는 단일 복사본입니다.
생성자: 정적일 수 없으며 객체를 초기화합니다.
정적 메서드 오버라이딩(가려짐): 컴파일 시간에 해결됩니다.
오버라이딩 방지: 비공개 및 final 수식어.
추상 클래스 vs. 인터페이스: 추상 클래스에는 추상이 아닌 메서드가 있을 수 있으며, 인터페이스에는 Java 8부터 정적 및 기본 메서드가 있을 수 있습니다.
불변 클래스: 생성 후 변경할 수 없습니다.
불변 클래스 생성:
- 클래스를 final로 만듭니다.
- 필드를 비공개로 만듭니다.
- 세터가 없습니다.
String, StringBuffer, StringBuilder: String은 불변입니다. StringBuffer는 동기화됩니다.
문자열 풀: Java 힙에 있는 문자열 리터럴의 저장 영역입니다.
Fail-fast vs. Fail-safe 반복자: Fail-fast 반복자는 수정 시 오류를 throw하며, fail-safe 반복자는 복제본에서 작동합니다.
ArrayList vs. LinkedList: ArrayList는 동적 배열을 사용하며, LinkedList는 이중 연결 목록을 사용합니다.
LinkedHashMap: 순서를 위해 해시 테이블과 연결된 목록을 결합합니다.
Streams API: 함수형 방식으로 컬렉션 처리를 가능하게 합니다.
스레드: 독립적 실행 경로이며, Thread를 확장하거나 Runnable을 구현하여 생성될 수 있습니다.
Callable: Runnable의 향상된 버전으로, Future 객체를 반환합니다.
Volatile 키워드: 변경 사항을 직접 주 메모리로 플러시합니다.
Transient 키워드: 직렬화에서 필드를 제외합니다.

Java에서의 Garbage Collection

Garbage collection은 힙 메모리를 확인하여 사용 중인 객체와 그렇지 않은 객체를 식별하고 사용하지 않는 객체를 삭제하는 과정입니다.
가비지 컬렉터 스레드가 실행될 때 다른 스레드는 잠깐 멈추므로 Stop The World라고 부릅니다.
System.gc()를 호출하는 것은 가비지 컬렉터를 실행할 것을 제안하는 것뿐이며, JVM이 언제 실행할지 결정합니다.
가비지 컬렉터에는 표시, 삭제, 압축과 같은 3단계가 있습니다.
Java 힙에는 젊은 세대와 구형 세대 공간이 있습니다. 젊은 세대에는 Eden 공간과 2개의 Survivor 공간이 있습니다. 캐시는 구형 세대 공간에 있을 수 있습니다. 우리는 다른 공간을 설정하고 조정할 수 있습니다.
Serial, Parallel과 같은 여러 유형의 GC가 있습니다. 명령줄에서 -XX:+UseSerialGC, -XX:+UseParallelGC, -XX:+UseParallelOldGC, -XX:+UseParNewGC와 같이 사용할 수 있습니다.

HashMap 구현

HashMap: 버킷의 배열, 각 버킷은 노드의 연결 리스트입니다.
해싱: hashcode()를 사용하여 문자열을 짧은 값으로 변환합니다.
충돌 처리: Java 8+에서 고충돌 시나리오에 대해 연결 리스트나 이진 트리를 사용합니다.

Spring

Spring Framework: Java 애플리케이션을 위한 가벼운 프레임워크로, IoC, AOP, 트랜잭션, MVC 및 예외 처리를 제공합니다.
Spring IoC: 객체의 제어를 컨테이너로 전환하여 라이프사이클과 의존성을 관리합니다.
AOP: 교차 관심사를 분리함으로써 모듈화 수준을 높입니다.
Spring Boot: Spring Framework 위에 구축되었으며, 자동 구성 및 내장형 애플리케이션 서버 지원이 제공됩니다.
Dependency Injection: 객체가 의존하는 다른 객체를 받아들이는 설계 패턴으로, 느슨한 결합을 촉진합니다.

시스템 설계를 잘하는 방법

기초