본문 바로가기

Contact English

【알고리즘】 2강. 탐색 알고리즘

 

2강. 탐색 알고리즘(search algorithm)

 

추천글 : 【알고리즘】 알고리즘 목차


1. 개요 [본문]

2. 선형탐색 [본문]

3. 이진탐색 [본문]

4. 기타 탐색 알고리즘 [본문]


a. 탐색 알고리즘 실험


 

1. 개요 [목차]

⑴ 탐색(search)

① 배열 C ={a1, a2, ···, an}이 있고 키 e가 있을 때 ai = e인 ai를 찾는 과정

② 위 조건을 만족하는 가장 최초의 원소

또는, 위 조건을 만족하는 가장 최후의 원소

또는, 위 조건을 만족하는 모든 원소

⑵ 배열 C가 정렬된 배열일 수도 있고, 정렬되지 않은 배열일 수도 있음

① 선형탐색 : O(N)

② 이진탐색 : O(log2 N)

③ 정렬 후 1번 탐색 : O(N log2 N) + O(log2 N) = O(N log2 N)

④ 정렬 후 N번 탐색 : O(N log2 N) + N × O(log2 N) = O(N log2 N)

⑤ 정렬된 배열을 N번 탐색 : N × O(log2 N) = O(N log2 N)

 

 

2. 선형탐색(linear search) [목차]

⑴ 개요

① 각 원소를 차례대로 훑으면서 특정 원소가 있는지 확인하는 방법

② 정렬된 배열이어도 되고 정렬되지 않은 배열이어도 됨

③ 시간복잡도

 

 

⑵ 알고리즘 (Python) 

① 탐색 여부를 반환하는 선형 탐색 알고리즘

 

def linear_search (l, e):
    found = False
    for i in l:
        if(i == e):
            found = True
    return found

 

② 탐색된 원소의 순서를 반환하는 선형 탐색 알고리즘

 

def linear_search_idx (l, e):
    n = len(l)
    idx = -1
    for i in range(n):
        if(l[i] == e):
            idx = i
    return idx

 

③ 정렬된 배열에 대한 선형 탐색 알고리즘

 

def linear_search_sorted (l, e):
    found = False
    for i in l:
        if(l[i] == e):
            found = True
            break
        if(i > e):
            found = False
            break
    return found

 

 

3. 이진탐색(binary search) : 이진트리탐색(binary tree search)이라고도 함 [목차]

⑴ 개요

① 이진 탐색은 반드시 정렬된 알고리즘을 전제로 함

⑵ 이진 트리(binary tree)

① 정의 : 차수(degree)가 2 이하인 노드들로 구성된 트리, 즉 자식이 둘 이하인 노드들로만 구성된 트리

② 이진 트리의 레벨 i에서 최대 노들의 수는 2i-1 

종류 1. 정이진 트리(Full Binary Tree) : 꽉 차 있는 트리

종류 2. 전이진 트리(Complete Binary Tree) : 맨 마지막 잎만 차 있지 않은 경우

종류 3. 사향 이진 트리(Skewed Binary Tree) : 왼쪽 혹은 오른쪽으로만 자식이 있는 특별한 이진트리

⑶ 탐색의 원리

4, 6, 5, 3, 7, 2와 같은 수열이 주어져 있을 때 이진트리는 다음과 같이 구성해 보자. 

 

 

 

우선 4가 root에 붙고, 그 뒤 온 6이 4보다 크므로 4의 오른쪽으로 붙는다. 또 5는 4보다 크므로 6의 방향으로 가는데, 6보다 크기가 작으므로 6의 왼쪽에 붙는다. 이런 식으로 트리가 구성된다. 각 node의 명칭부터 살펴보면 직접적으로 연결돼 있는 두 node 중 root와 가까운 쪽을 parent node, root에서 먼 쪽을 sibling node라고 부른다. 또, sibling node는 앞서 트리를 구성하는 과정에서도 보았듯 left sibling node와 right sibling node가 있다. 더 나아가 한 node에서 다른 node로 쭉 내려가는 경로가 있다면, 전자를 ancestor node, 후자를 descendant node라고 부른다.

 

이진트리 내 각 node를 이진법으로 나타내면 여러 연산을 처리하기 용이하다. 이때 각 대체수는 다음과 같이 정의된다.

 

 

그러면 4는 1, 3은 10, 6은 11, 5는 110이 된다.

 

주어진 이진트리 내에서 특정 값이 있는지를 찾아보는 과정을 이진트리탐색 혹은 이진트리순회라고 한다. 이진트리탐색은 총 4가지 방법이 있다. 첫째, in-order traversal은 왼쪽, 가운데, 오른쪽 순으로 탐색하는 방법으로, 2-3-4-5-6-7로 순회할 수 있다. 탐색하는 node의 순서를 출력하면, 트리 내 node의 값을 크기순서로 출력하는 결과를 얻는다. 둘째, level-order traversal는 각 node의 level(root로부터의 최단거리)가 작은 순서대로 node를 탐색하는 방법이다. 4-3-6-2-5-7로 순회할 수 있다. 셋째, pre-order traversal은 가운데, 왼쪽, 오른쪽 순으로 탐색하는 방법으로으로 4-3-2-6-5-7로 순회할 수 있다. 마지막으로 post-order traversal은 왼쪽, 오른쪽, 가운데 순으로 탐색하는 방법으로 2-3-5-7-6-4로 순회할 수 있다. 이진트리탐색을 알고리즘으로 구현할 시 재귀 함수로 하는 게 일반적이다. 가령 in-order traversal을 구현할 시 f(4) = f(3) + 4 + f(6)과 같이 하는 식이다. 즉,

 

 

이제 level-ancestor(LA) 연산에 대해 소개하겠다. LA(x, k)는 x의 값을 가지는 node의 ancestor node 중 level이 k인 node의 값이 얼마인지를 나타낸다. 예를 들어, LA(2, 1) = 3이고, LA(5, 3) = -1이다. 이때, -1은 예외의 상황을 위한 값으로 그 예시처럼 주어진 node보다 높은 level을 말하면 항상 -1이 된다. 이 연산도 대체수를 이용하면 쉽게 계산된다.

 

 

이때 log 값은 x의 대체수의 자릿수 - 1이다. 이 값은 쉽게 구할 수 있다.

 

또다른 연산은 lowest-common-ancestor(LCA)이다. LCA(x, y)는 x 값을 가지는 node와 y 값을 가지는 node의 공통 ancestor node 중에서 가장 가까운(= 가장 level이 큰) node의 값이 얼마냐 하는 것이다. 예를 들어, LCA(5, 7) = 6, LCA(2, 6) = 4인 식이다. 이것도 대체수를 이용해서 계산할 수 있다.

 

 

이밖에도 여러 연산들이 있으며, 이 또한 대체수를 이용해서 계산된다. 이렇듯 창의적인 방법론이 문제를 얼마나 쉽게 바꿔 버리는지를 주목하길 바란다.

⑷ 알고리즘 (Python)

① 재귀함수를 이용한 알고리즘 

 

def binary_search (l, e):
    def bs(l, low, high, e):
        if(low > high):
            return -1
        i = int((low+high)/2)
        if(l[i] == e):
            return i
        elif (l[i] < e):
            i = bs(l, i+1, high, e)
        else:
            i = bs(l, low, i-1, e)
        return i
    return bs(l, 0, len(l)-1, e)

 

② 반복을 이용한 알고리즘

 

def binary_search_iter (l, e):
    low = 0
    high = len(l) - 1
    while(low < high):
        i = int((high + low) / 2)
        if(l[i] == e):
            return i
        elif(l[i] < e):
            low = i + 1
        else:
            high = i-1
    return -1;

 

 

4. 기타 탐색 알고리즘 [목차]

종류 1. elastic search : 구글에서도 쓰는 자연어 서치 알고리즘

 

입력: 2016.09.18 21:47