📌 그래프(Graph)란?
Vertax(점점)와 Edge(간선)로 구성된 한정된 자료구조를 의미한다.
자료구조에서의 그래프는 수학에서 사용되는 X축이나 Y축의 값을 나타내는 그래프를 말하는 것이 아니다. 자료구조에서의 그래프는 마치 거미줄처럼 여러 개의 점들이 선으로 이어져 있는 복잡한 네트워크망과 같은 모습을 가지고 있다.
📌 용어 설명
노드 (Node) / 정점(Vertax) : 특정 위치
간선 (Edge) : 위치 간의 관계, 정점을 연결한 선
정점 1과 정점 4는 간선으로 연결되어있으므로 두 노드는 인접(Adjacent)하다.
차수(Degree)
→ 무방향 그래프에서 하나의 정점에 인접한 정점의 수
→ 무방향 그래프 차수의 합 : 그래프 간선 수 x 2
진입 차수(In-Degree)
→ 방향 그래프에서 외부에서 오는 간선의 수 (내차수)
진출 차수(Out-Degree)
→ 방향 그래프에서 외부로 향하는 간선의 수 (외차수)
무방향 그래프(Undirected Graph)
→ 방향이 없는 간선으로 이루어진 그래프
→ 간선은 간선을 통해 양방향으로 갈 수 있다.
→ 정점 0, 1을 연결하는 간선은 (0, 1) or (1, 0)으로 동일
방향 그래프(Directed Graph)
→ 방향이 있는 간선으로 이루어진 그래프
→ 0에서 1로 가는 간선은 (0, 1)로 표현, (1, 0)과는 다르다.
가중치 그래프(Weighted Graph)
→ 가중치 혹은 비용을 갖는 그래프
→ 도시-도시의 연결, 도로의 길이, 톨게이트 비용 등
완전 그래프(Complete Graph)
→ 서로 다른 두 개의 꼭짓점이 반드시 하나의 변으로 연결된 그래프
→ 완전 그래프는 정규 그래프(모든 정점이 동일한 차수)
→ N개의 정점을 가지는 무방향 그래프 : 간선의 개수 = 1/2 * N * (N - 1)
→ N개의 정점을 가지는 방향 그래프 : 간선의 개수 = N * (N - 1)
연결 그래프(Connected Graph)
→ 무방향 그래프에 있는 모든 정점에 대해서 항상 경로가 존재하는 경우
비연결 그래프(Disconnected Graph)
→ 무방향 그래프에서 특정 정점 사이에 경로가 존재하지 않는 경우
📌 그래프의 표현 방식
✔️ 인접 행렬
두 정점을 바로 이어주는 간선이 있다면 이 두 정점은 인접(Adjacent)하다고 한다.
인접 행렬은 서로 다른 정점들이 인접한 상태인지를 표시한 행렬로 2차원의 배열 형태로 나타낸다. 만약 A라는 정점과 B라는 정점이 이어져 있다면 1(true), 이어져 있지 않다면 0(false)으로 표시한 일종의 표이다. 만약 가중치 그래프라면 1 대신 관계에서 의미 있는 값을 저장한다.
❗️무방향 그래프의 인접 행렬
먼저 자기 자신에 대한 인접 행렬의 값(대각선의 값)은 무조건 0이다. 그 뒤, 연결된 간선을 파악하여 접점 간에 인접을 행렬로 표현한다.
❗️방향 그래프의 인접 행렬
순차적으로 1, 2, 3, 4를 비교해보자.
- 1의 진출 차수는 1개다. : 1 → 4
[0][3] == 1 - 2의 진출 차수는 2개다. : 2 → 3 , 2 → 4
[1][2] == 1
[1][3] == 1 - 3의 진출 차수는 1개다. : 3 → 4
[2][3] == 1 - 4의 진출 차수는 1개다. : 4 → 2
[3][1] == 1
인접 행렬은 언제 사용할까?
- 한 개의 큰 표와 같은 모습을 한 인접 행렬은 두 정점 사이에 관계가 있는지, 없는지 확인하기에 용이하다. 예를 들어, 2에서 3으로 진출하는 간선이 있는지 파악하기 위해선 1 번째 줄의 3 번째 열에 어떤 값이 있는지 접근하기만 하면 된다.
- 가장 빠른 경로(shortest path)를 찾고자 할 때 주로 사용된다.
✔️ 인접 리스트
인접 리스트는 각 정점이 어떤 정점과 인접하는지를 리스트의 형태료 표현한다.
각 정점마다 하나의 리스트를 가지고 있으며, 이 리스트는 자신과 인접한 다른 정점을 담고 있다. 위 그래프(방향 그래프)를 인접 리스트로 표현하자면 다음과 같다.
- 이미 방문한 접점은 고려하지 않는다.
예를 들어 1 → 4 → 2 → 3 → 4의 사이클이 있다면, 인접 리스트는 1 → 4 → 2 → 3이 된다. - 각 리스트의 연결 노드의 순서는 의미가 없다.
adjacent[1]에서 2, 3, 4 순이 아닌 3, 2, 4가 되어도 상관없다. 각 노드 사이에 존재하는 화살표는 포인터가 아니라 단순히 노드가 푸쉬된 순서를 의미한다. - 사이클을 돌거나 방문할 접점이 없는 경우, 그 인접 리스트의 종료 지점이 된다.
- 접점의 방문에 우선 순위를 고려할 수도 있다.
보통의 경우 우선 순위를 다루는 더 적합한 자료구조를 사용하는 것이 합리적이긴 하다.
무방향 그래프에서의 인접 리스트 표현은 다음과 같다.
❗️인접 리스트는 언제 사용할까?
- 메모리를 효율적으로 사용하고 싶을 때 사용한다.
인접 행렬은 연결 가능한 모든 경우의 수를 저장하기 때문에 상대적으로 메모리를 많이 차지한다.
📌 그래프의 활용
그래프 자료구조는 우리의 생활에서 사용되는 곳이 많다. 포털 사이트의 검색 엔진, SNS에서 사람들과의 관계, 내비게이션 (길 찾기) 등에서 사용하는 자료구조가 바로 그래프이다. 세 가지 모두 수많은 정점을 가지고 있고, 서로 관계가 있는 정점은 간선으로 이루어져 있다.
이 중 내비게이션 시스템이 어떤 방식으로 자료구조 그래프를 사용하는지 살펴보자.
서울에 사는 A는 부산에 사는 B와 오랜 친구 사이다. 이번 주말에 부산에서 열리는 B의 결혼식에 참석하기 위해 A는 차를 몰고 부산으로 가려고 한다. 대전에 살고 있는 친구 C도 B의 결혼식에 참석한다고 하여, A는 서울에서 출발하여 대전에서 C를 태워 부산으로 이동하려 한다.
위의 예제에서는 3개의 정점이 존재한다. A, B, C가 사는 각각의 도시(서울, 부산, 대전)를 그래프의 정점으로 삼을 수 있으며, 이 3개의 정점은 서로 이어지는 간선(관계)을 가지고 있다.
- 정점 : 서울, 대전, 부산
- 간선 : 서울-대전, 대전-부산, 부산-서울
위에서 볼 수 있듯이,
서울, 대전, 부산 사이에 간선이 존재하는데, 이 간선은 내비게이션에서 이동할 수 있음을 나타낸다. 정점에 캐나다의 토론토를 추가한다면 어떻게 될까? 자동차로는 토론토에서 한국으로 이동할 수 없기 때문에 어떠한 간선도 추가할 수 없다. 그래프에선 이런 경우를 관계가 없다라고 표현한다.
예제로 돌아가서,
간선을 살펴보면 서울, 대전, 부산이 서로 관계가 있다는 것은 알 수 있지만, 각 도시가 얼마나 떨어져 있는지는 알 수가 없다. 간선은 특정 도시 두 개가 이어져 있다는 사실만 알려줄 뿐, 그 외의 정보는 포함하고 있지 않다.
이렇게 추가적인 정보를 파악할 수 없는 그래프, 가중치(연결의 강도가 얼마나 되는지)가 적혀 있지 않은 그래프를 비가중치 그래프라고 한다. 위의 예제를 1, 2, 3이라는 객체로 표현하자면 다음과 같다.
/*
1 == 서울, 2 == 부산, 3 == 대전
0은 연결되지 않은 상태, 1은 연결된 상태 (간선을 정수로 표현)
*/
[1] = [0, 1, 1] // 서울 - 부산 , 서울 - 대전
[2] = [1, 0, 1] // 부산 - 서울 , 부산 - 대전
[3] = [1, 1, 0] // 대전 - 서울 , 대전 - 부산
※ [코드] 비가중치 그래프로 나타낸 서울, 대전, 부산 그래프
위 정보만으로는 서울에서 부산까지 갈 수 있다는 사실 외에 파악할 수 있는 정보가 없다. 내비게이션이라면, 적어도 각 도시 간의 거리가 얼마나 되는지는 표시해야 한다. 현재의 비가중치 그래프를 가중치 그래프로 바꾸고, 각 도시 간의 거리를 표현한다면 다음과 같다.
- 정점 : 서울, 대전, 부산
- 간선 : 서울-140km-대전, 대전-200km-부산, 부산-325km-서울
이렇게 간선과 연결 정도(거리 등)를 표현한 그래프를 가중치 그래프라고 한다. 내비게이션은 간선에 거리를 표기한 가중치 그래프가 확장되어, 수백만 개의 정점(주소)와 간선이 추가되어야 비로소 내비게이션에서 쓰는 자료구조와 유사해진다.
📌 그래프의 구현(작성 예정)
댓글