Skip to content

275. H 指数 II

题目

给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数,citations 已经按照 升序排列 。计算并返回该研究者的 h 指数。

h 指数的定义h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (n 篇论文中)至少h 篇论文分别被引用了至少 h 次。

请你设计并实现对数时间复杂度的算法解决此问题。

示例 1:

输入:citations = [0,1,3,5,6]
输出:3
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 0, 1, 3, 5, 6 次。
     由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3 。

示例 2:

输入:citations = [1,2,100]
输出:2

提示:

  • n == citations.length
  • 1 <= n <= 10^5
  • 0 <= citations[i] <= 1000
  • citations升序排列

解答

思路

二分的前提:单调性

  • 如果至少有 2 篇论文的引用次数 2,那么必然至少有 1 篇论文的引用次数 1
  • 如果没有 4 篇论文的引用次数 4,那么一定没有 5 篇论文的引用次数 5
  • 因此有序列表一定为 [y, y, y, ..., n, n] 排列,我们要求的是 分界点
  • 注意二分的是论文的 篇数,也就是 1n

二分查找的询问:是否有至少 i 篇论文的引用次数 i

也就是判断 citations[n - i] 是否 >= i,因为 citations[] 呈升序排列。

区间内未染色的就是未经判断的,因此起始区间为 [1, n + 1),是因为 0 一定正确,而也有可能 citations[] 中的所有数都 >= n,例如 [6, 6, 6] 这种情况。

根据循环不变量,循环退出时 right = left 均表示第一个不满足要求的下标值。因为满足要求的一定是按照 [y, y, y, y, n, n, n] 这样分布的。

C++ 代码

cpp
class Solution {
public:
    int hIndex(vector<int>& citations) {
        int n = citations.size();
        int left = 1;
        int right = n + 1;

        while (left < right) {
            int mid = (left + right) / 2;

            if (citations[n - mid] >= mid) {
                left = mid + 1;
            }
            else {
                right = mid;
            }
        }

        return right - 1;
    }
};

Python 代码

python
class Solution:
    def hIndex(self, citations: List[int]) -> int:
        n = len(citations)
        l = 1
        r = n

        while l <= r:
            mid = (l + r) // 2

            if (citations[n - mid] >= mid):
                l = mid + 1
            else:
                r = mid - 1
        

        return r

Released under the MIT License.