二分查找简介

二分查找也称折半查找（Binary Search），它是一种效率较高的查找方法。但是，折半查找要求线性表必须采用顺序存储结构，而且表中元素按关键字有序排列。

算法要求

必须采用顺序存储结构
必须按关键字大小有序排序

时间复杂度

$O(\log_{2}{n})$

二分查找框架

int binarySearch(int[] nums, int target) {
    int left = 0, right = ...;

    while(...) {
        int mid = left + ((right - left) / 2);
        if (nums[mid] > target) {
            right = ...
        } else if (nums[mid] < target) {
            left = ...
        } else {
            ...
        }
    }
    return ...;
}

... 标记的地方是需要特别注意的地方
代码中用 left + (right - left) / 2 来代替 (left + right) / 2 ，可以有效地防止 left 和 right 太大导致相加后溢出。也可以使用 left + (right - left) >> 1 ，使用位运算会更快

基本的二分查找

搜索一个数，如果存在，返回其索引，否则返回 -1

查找区间为[left, right]的写法

第一种写法，我们定义 target 是在一个在左闭右闭的区间里，也就是[left, right] （这个很重要非常重要）。

区间的定义决定了二分法的代码应该如何写，因为定义target在[left, right]区间，所以有如下两点：

while (left <= right) 要使用 <= ，因为left == right是有意义的，所以使用 <=
if (nums[mid] > target) right 要赋值为 mid - 1，因为当前这个nums[mid]一定不是target，那么接下来要查找的左区间结束下标位置就是 mid - 1

例如在数组：1,2,3,4,7,9,10中查找元素2，如图所示：

int search(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size() - 1; // 定义target在左闭右闭的区间里[left, right]
    while (left <= right) { // 当left==right，区间[left, right]依然有效，所以用 <=
        int mid = left + ((right - left) / 2);// 防止溢出 等同于(left + right) / 2
        if (nums[mid] > target) {
            right = mid - 1; // target 在左区间，所以[left, mid - 1]
        } else if (nums[mid] < target) {
            left = mid + 1; // target 在右区间，所以[mid + 1, right]
        } else { // nums[mid] == target
            return mid; // 数组中找到目标值，直接返回下标
        }
    }
    // 未找到目标值
    return -1;
}

查找区间为[left, right)的写法

如果说定义 target 是在一个在左闭右开的区间里，也就是[left, right) ，那么二分法的边界处理方式则截然不同。

有如下两点：

while (left < right)，这里使用 < ,因为left == right在区间[left, right)是没有意义的
if (nums[mid] > target) right 更新为 mid，因为当前nums[mid]不等于target，去左区间继续寻找，而寻找区间是左闭右开区间，所以right更新为mid，即：下一个查询区间不会去比较nums[mid]

在数组：1,2,3,4,7,9,10中查找元素2，如图所示：（注意和方法一的区别）

int search(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size(); // 定义target在左闭右开的区间里，即：[left, right)
    while (left < right) { // 因为left == right的时候，在[left, right)是无效的空间，所以使用 <
        int mid = left + ((right - left) / 2);
        if (nums[mid] > target) {
            right = mid; // target 在左区间，在[left, mid)中
        } else if (nums[mid] < target) {
            left = mid + 1; // target 在右区间，在[mid + 1, right)中
        } else { // nums[mid] == target
            return mid; // 数组中找到目标值，直接返回下标
        }
    }
    // 未找到目标值
    return -1;
}

寻找一个数的左右边界

具体见STL中lower_bound和upper_bound的用法

查找左侧边界

int lower_bound(vector<int> &nums, int k)
{
    int left = 0, right = nums.size() - 1;
    while (left < right)
    {
        int mid = left + ((right - left) >> 1);
        if (nums[mid] >= k)
            right = mid;
        else
            left = mid + 1;
    }
    if (nums[left] < k)
        left++;
    return left;
}

查找右侧边界

int upper_bound(vector<int> &nums, int k)
{
    int left = 0, right = nums.size() - 1;
    while (left < right)
    {
        int mid = left + ((right - left) >> 1);
        if (nums[mid] > k)
            right = mid;
        else
            left = mid + 1;
    }
    if (nums[left] <= k)
        left++;
    return left;
}

*寻找重复值的左右边界

寻找一个数在单调不递减序列中第一次出现的位置（左侧边界）和最后一次出现的位置（右侧边界），如果不存在该数则返回 -1

寻找左侧边界

查找区间为[left, right]的写法

int left_bound(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size() - 1;
    // 搜索区间为[left, right]
    while (left <= right) {
        int mid = left + ((right - left) / 2);
        if (nums[mid] < target) {
            // 搜索区间变为[mid + 1, right]
            left = mid + 1;
        } else if (nums[mid] > target) {
            // 搜索区间变为[left, mid - 1]
            right = mid - 1;
        } else {
            // 收缩右侧边界
            // 如果存在target，那right最后必定是target左边界的位置减1
            right = mid - 1;
        }
    }
    // 检查出界情况
    // left == right + 1跳出循环
    if (left >= nums.size())
        return -1;
    return nums[left] == target ? left : -1;
}

查找区间为[left, right)的写法

int left_bound(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size(); // 注意
    // 搜索区间为[left, right)
    while (left < right) { // 注意
        int mid = ((left + right) / 2);
        if (nums[mid] == target) {
            right = mid;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid; // 注意
        }
    }
    // target比所有数都大
    if (left == nums.size())
        return -1;
    // 类似之前算法的处理方式
    return nums[left] == target ? left : -1;
}

寻找右侧边界

查找区间为[left, right]的写法

int right_bound(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size() - 1;
    
    while (left <= right) {
        int mid = left + ((right - left) / 2);
        if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            // 如果存在target，那right最后就是右边界
            // 如果不存在target，right是第一个小于target的值
            right = mid - 1;  
        } else {
            // 这里改成收缩左侧边界即可
            left = mid + 1;
        }
    }
    if (left <= 0)
        return -1;
    return nums[left - 1] == target ? left - 1 : -1;
}

查找区间为[left, right)的写法

int right_bound(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size();

    while (left < right) {
        int mid = left + ((right - left) / 2);
        if (nums[mid] == target) {
            left = mid + 1; // 注意
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            // 如果存在target, 那right最后是target右边界加1的位置
            right = mid;
        }
    }
    
    if (left == 0)
        return -1;
    return nums[left - 1] == target ? left - 1 : -1;
}