Бінарний пошук

Бінарний пошук — це метод, який дозволяє швидше шукати щось шляхом розбиття інтервалу пошуку на дві частини. Найпоширеніше його застосування — пошук значень у відсортованих масивах, однак сама ідея розбиття є ключовою в багатьох інших типових задачах.

Коли підходить цей алгоритм?

Масив відсортований або предикат монотонний («якщо $x$ підходить, то і все більше за $x$ підходить»)? (якщо ні, а функція унімодальна — спершу зростає, потім спадає → Тернарний пошук)
Шукаєте конкретне значення / точку переходу, а не максимум чи мінімум функції?
Корінь гладкої функції з відомою похідною, де потрібна швидка квадратична збіжність? (якщо так → Метод Ньютона)

Пошук у відсортованих масивах

Найтиповіша задача, яка приводить до бінарного пошуку, виглядає так. Вам дано відсортований масив $A_0 \leq A_1 \leq \dots \leq A_{n-1}$ , перевірте, чи присутнє $k$ у цій послідовності. Найпростіший розв'язок — перевіряти кожен елемент по черзі й порівнювати його з $k$ (так званий лінійний пошук). Цей підхід працює за $O(n)$ , але не використовує того факту, що масив відсортований.

Бінарний пошук значення $7$ у масиві.
Зображення від AlwaysAngry поширюється за ліцензією CC BY-SA 4.0.

Тепер припустимо, що ми знаємо два індекси $L < R$ такі, що $A_L \leq k \leq A_R$ . Оскільки масив відсортований, ми можемо зробити висновок, що $k$ або зустрічається серед $A_L, A_{L+1}, \dots, A_R$ , або не зустрічається в масиві взагалі. Якщо ми оберемо довільний індекс $M$ такий, що $L < M < R$ , і перевіримо, чи $k$ менше за $A_M$ , чи більше. Маємо два можливі випадки:

$A_L \leq k \leq A_M$ . У цьому випадку ми зводимо задачу з $[L, R]$ до $[L, M]$ ;
$A_M \leq k \leq A_R$ . У цьому випадку ми зводимо задачу з $[L, R]$ до $[M, R]$ .

Коли неможливо обрати $M$ , тобто коли $R = L + 1$ , ми безпосередньо порівнюємо $k$ з $A_L$ і $A_R$ . Інакше ми хотіли б обрати $M$ так, щоб якнайшвидше звести активний відрізок до одного елемента в найгіршому випадку.

Оскільки в найгіршому випадку ми завжди зводитимемо до більшого з відрізків $[L, M]$ і $[M, R]$ . Отже, у найгіршому сценарії зведення відбуватиметься від $R-L$ до $\max(M-L, R-M)$ . Щоб мінімізувати це значення, ми маємо обрати $M \approx \frac{L+R}{2}$ , тоді

M-L \approx \frac{R-L}{2} \approx R-M.

Іншими словами, з точки зору найгіршого випадку оптимально завжди обирати $M$ посередині $[L, R]$ і ділити його навпіл. Отже, активний відрізок зменшується вдвічі на кожному кроці, доки не стане розміром $1$ . Тож, якщо процес потребує $h$ кроків, то наприкінці він зменшує різницю між $R$ і $L$ з $R-L$ до $\frac{R-L}{2^h} \approx 1$ , що дає нам рівняння $2^h \approx R-L$ .

Узявши $\log_2$ від обох частин, отримуємо $h \approx \log_2(R-L) \in O(\log n)$ .

Логарифмічна кількість кроків разюче краща, ніж у лінійного пошуку. Наприклад, для $n \approx 2^{20} \approx 10^6$ для лінійного пошуку вам знадобилося б приблизно мільйон операцій, але лише близько $20$ операцій з бінарним пошуком.

Нижня та верхня межі

Часто зручніше знайти позицію першого елемента, який більший або рівний за $k$ (так звана нижня межа $k$ у масиві), або позицію першого елемента, який більший за $k$ (так звана верхня межа $k$ ), ніж точну позицію елемента.

Разом нижня та верхня межі утворюють (можливо, порожній) напівінтервал елементів масиву, які дорівнюють $k$ . Щоб перевірити, чи присутнє $k$ у масиві, достатньо знайти його нижню межу й перевірити, чи відповідний елемент дорівнює $k$ .

Реалізація

Пояснення вище дає приблизний опис алгоритму. Для деталей реалізації нам потрібно бути точнішими.

Ми підтримуватимемо пару $L < R$ таку, що $A_L \leq k < A_R$ . Це означає, що активний інтервал пошуку — це $[L, R)$ . Ми використовуємо тут напівінтервал замість відрізка $[L, R]$ , бо це, як виявляється, потребує менше роботи з крайовими випадками.

Коли $R = L+1$ , з наведених вище означень ми можемо зробити висновок, що $R$ — це верхня межа $k$ . Зручно ініціалізувати $R$ індексом за межею масиву, тобто $R=n$ , а $L$ — індексом перед початком масиву, тобто $L=-1$ . Це нормально, доки ми ніколи не обчислюємо $A_L$ і $A_R$ безпосередньо в нашому алгоритмі, формально вважаючи їх $A_L = -\infty$ і $A_R = +\infty$ .

Нарешті, щоб конкретизувати значення $M$ , яке ми обираємо, ми зупинимося на $M = \lfloor \frac{L+R}{2} \rfloor$ .

Тоді реалізація могла б виглядати так:

C++
Python
TypeScript
Go

... // відсортований масив зберігається як a[0], a[1], ..., a[n-1]
int l = -1, r = n;
while (r - l > 1) {
    int m = (l + r) / 2;
    if (k < a[m]) {
        r = m; // a[l] <= k < a[m] <= a[r]
    } else {
        l = m; // a[l] <= a[m] <= k < a[r]
    }
}

# a — відсортований масив a[0], a[1], ..., a[n-1]
l, r = -1, n
while r - l > 1:
    m = (l + r) // 2
    if k < a[m]:
        r = m  # a[l] <= k < a[m] <= a[r]
    else:
        l = m  # a[l] <= a[m] <= k < a[r]
# Тут r — це верхня межа; у стандартній бібліотеці те саме дає
# bisect.bisect_right(a, k), а нижню межу — bisect.bisect_left(a, k).

// a — відсортований масив a[0], a[1], ..., a[n-1]
let l = -1, r = n;
while (r - l > 1) {
  const m = Math.floor((l + r) / 2);
  if (k < a[m]) {
    r = m; // a[l] <= k < a[m] <= a[r]
  } else {
    l = m; // a[l] <= a[m] <= k < a[r]
  }
}

// a — відсортований масив a[0], a[1], ..., a[n-1]
l, r := -1, n
for r-l > 1 {
    m := (l + r) / 2
    if k < a[m] {
        r = m // a[l] <= k < a[m] <= a[r]
    } else {
        l = m // a[l] <= a[m] <= k < a[r]
    }
}
// Аналог зі стандартної бібліотеки: sort.SearchInts(a, k+1) дає верхню
// межу (r), а sort.SearchInts(a, k) — нижню межу.

Під час виконання алгоритму ми ніколи не обчислюємо ні $A_L$ , ні $A_R$ , оскільки $L < M < R$ . Наприкінці $L$ буде індексом останнього елемента, який не більший за $k$ (або $-1$ , якщо такого елемента немає), а $R$ буде індексом першого елемента, більшого за $k$ (або $n$ , якщо такого елемента немає).

Зауваження. Обчислення m як m = (r + l) / 2 може призвести до переповнення, якщо l і r — два додатні цілі числа, і ця помилка прожила близько 9 років у JDK, як описано в блогпості. Деякі альтернативні підходи включають, наприклад, запис m = l + (r - l) / 2, який завжди працює для додатних цілих l і r, але все одно може переповнитися, якщо l — від'ємне число. Якщо ви використовуєте C++20, він пропонує альтернативне рішення у вигляді m = std::midpoint(l, r), яке завжди працює коректно.

Пошук за довільним предикатом

Нехай $f : \{0,1,\dots, n-1\} \to \{0, 1\}$ — булева функція, визначена на $0,1,\dots,n-1$ так, що вона монотонно зростає, тобто

f(0) \leq f(1) \leq \dots \leq f(n-1).

Бінарний пошук у тому вигляді, як його описано вище, знаходить розбиття масиву за предикатом $f(M)$ , що містить булеве значення виразу $k < A_M$ . Замість $k < A_M$ можна використати довільний монотонний предикат. Це особливо корисно, коли обчислення $f(k)$ потребує надто багато часу, щоб насправді обчислювати його для кожного можливого значення. Іншими словами, бінарний пошук знаходить єдиний індекс $L$ такий, що $f(L) = 0$ і $f(R)=f(L+1)=1$ , якщо така точка переходу існує, або дає нам $L = n-1$ , якщо $f(0) = \dots = f(n-1) = 0$ , або $L = -1$ , якщо $f(0) = \dots = f(n-1) = 1$ .

Доведення коректності за припущення, що точка переходу існує, тобто $f(0)=0$ і $f(n-1)=1$ : реалізація підтримує інваріант циклу $f(l)=0, f(r)=1$ . Коли $r - l > 1$ , вибір $m$ означає, що $r-l$ завжди зменшуватиметься. Цикл завершується, коли $r - l = 1$ , що дає нам бажану точку переходу.

C++
Python
TypeScript
Go

... // f(i) — це булева функція така, що f(0) <= ... <= f(n-1)
int l = -1, r = n;
while (r - l > 1) {
    int m = (l + r) / 2;
    if (f(m)) {
        r = m; // 0 = f(l) < f(m) = 1
    } else {
        l = m; // 0 = f(m) < f(r) = 1
    }
}

# f(i) — булева функція така, що f(0) <= ... <= f(n-1)
l, r = -1, n
while r - l > 1:
    m = (l + r) // 2
    if f(m):
        r = m  # 0 = f(l) < f(m) = 1
    else:
        l = m  # 0 = f(m) < f(r) = 1
# bisect.bisect_left із "ключем" теж шукає точку переходу монотонного
# предиката, але прямий цикл наочніший для довільного f.

// f(i) — булева функція така, що f(0) <= ... <= f(n-1)
let l = -1, r = n;
while (r - l > 1) {
  const m = Math.floor((l + r) / 2);
  if (f(m)) {
    r = m; // 0 = f(l) < f(m) = 1
  } else {
    l = m; // 0 = f(m) < f(r) = 1
  }
}

// f(i) — булева функція така, що f(0) <= ... <= f(n-1)
l, r := -1, n
for r-l > 1 {
    m := (l + r) / 2
    if f(m) {
        r = m // 0 = f(l) < f(m) = 1
    } else {
        l = m // 0 = f(m) < f(r) = 1
    }
}
// sort.Search(n, f) повертає той самий індекс переходу r для
// монотонного предиката f.

Бінарний пошук по відповіді

Така ситуація часто виникає, коли нас просять обчислити деяке значення, але ми здатні лише перевірити, чи це значення не менше за $i$ . Наприклад, вам дано масив $a_1,\dots,a_n$ і просять знайти максимальну заокруглену вниз середню суму

\left \lfloor \frac{a_l + a_{l+1} + \dots + a_r}{r-l+1} \right\rfloor

серед усіх можливих пар $l,r$ таких, що $r-l \geq x$ . Один із простих способів розв'язати цю задачу — перевіряти, чи відповідь не менша за $\lambda$ , тобто чи існує пара $l, r$ така, що виконується наступне:

\frac{a_l + a_{l+1} + \dots + a_r}{r-l+1} \geq \lambda.

Еквівалентно це переписується як

(a_l - \lambda) + (a_{l+1} - \lambda) + \dots + (a_r - \lambda) \geq 0,

тож тепер нам потрібно перевірити, чи існує підмасив нового масиву $a_i - \lambda$ довжиною щонайменше $x+1$ з невід'ємною сумою, що можна зробити за допомогою префіксних сум.

Неперервний пошук

Нехай $f : \mathbb R \to \mathbb R$ — дійснозначна функція, неперервна на відрізку $[L, R]$ .

Без втрати загальності припустимо, що $f(L) \leq f(R)$ . З теореми про проміжне значення випливає, що для будь-якого $y \in [f(L), f(R)]$ існує $x \in [L, R]$ таке, що $f(x) = y$ . Зауважимо, що, на відміну від попередніх параграфів, тут від функції не вимагається монотонності.

Значення $x$ можна наблизити з точністю до $\pm\delta$ за час $O\left(\log \frac{R-L}{\delta}\right)$ для будь-якого конкретного значення $\delta$ . Ідея, по суті, та сама: якщо ми візьмемо $M \in (L, R)$ , то зможемо звести інтервал пошуку або до $[L, M]$ , або до $[M, R]$ залежно від того, чи $f(M)$ більше за $y$ . Одним поширеним прикладом тут було б знаходження коренів многочленів непарного степеня.

Наприклад, нехай $f(x)=x^3 + ax^2 + bx + c$ . Тоді $f(L) \to -\infty$ і $f(R) \to +\infty$ при $L \to -\infty$ і $R \to +\infty$ . Це означає, що завжди можна знайти достатньо мале $L$ і достатньо велике $R$ такі, що $f(L) < 0$ і $f(R) > 0$ . Тоді за допомогою бінарного пошуку можна знайти як завгодно малий інтервал, що містить $x$ таке, що $f(x)=0$ .

Пошук зі степенями двійки

Ще один вартий уваги спосіб виконувати бінарний пошук — це, замість підтримки активного відрізка, підтримувати поточний вказівник $i$ і поточний степінь $k$ . Вказівник починається з $i=L$ , а потім на кожній ітерації тестується предикат у точці $i+2^k$ . Якщо предикат досі $0$ , вказівник просувається з $i$ до $i+2^k$ , інакше він залишається тим самим, після чого степінь $k$ зменшується на $1$ .

Ця парадигма широко використовується в задачах про дерева, таких як знаходження найнижчого спільного предка двох вершин або знаходження предка конкретної вершини, який має певну висоту. Її також можна адаптувати, наприклад, для знаходження $k$ -го ненульового елемента в дереві Фенвіка.

Бінарний пошук

Пошук у відсортованих масивах

Нижня та верхня межі

Реалізація

Пошук за довільним предикатом

Бінарний пошук по відповіді

Неперервний пошук

Пошук зі степенями двійки

Задачі для практики

Відеоматеріали

Пошук у відсортованих масивах​

Нижня та верхня межі​

Реалізація​

Пошук за довільним предикатом​

Бінарний пошук по відповіді​

Неперервний пошук​

Пошук зі степенями двійки​

Задачі для практики​

Відеоматеріали​

Пошук у відсортованих масивах

Нижня та верхня межі

Реалізація

Пошук за довільним предикатом

Бінарний пошук по відповіді

Неперервний пошук

Пошук зі степенями двійки

Задачі для практики

Відеоматеріали