275. H 指数 II
题目
给你一个整数数组 citations
,其中 citations[i]
表示研究者的第 i
篇论文被引用的次数,citations
已经按照 升序排列 。计算并返回该研究者的 h 指数。
h 指数的定义:h 代表“高引用次数”(high citations),一名科研人员的 h
指数是指他(她)的 (n
篇论文中)至少 有 h
篇论文分别被引用了至少 h
次。
请你设计并实现对数时间复杂度的算法解决此问题。
示例 1:
输入:citations = [0,1,3,5,6]
输出:3
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 0, 1, 3, 5, 6 次。
由于研究者有3篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3 。
示例 2:
输入:citations = [1,2,100]
输出:2
提示:
n == citations.length
1 <= n <= 10^5
0 <= citations[i] <= 1000
citations
按 升序排列
解答
思路
二分的前提:单调性
- 如果至少有
篇论文的引用次数 ,那么必然至少有 篇论文的引用次数 - 如果没有
篇论文的引用次数 ,那么一定没有 篇论文的引用次数
二分查找的询问:是否有至少
也就是判断 citations[n - i]
是否 >= i
,因为 citations[]
呈升序排列。
区间内未染色的就是未经判断的,因此起始区间为 [1, n + 1)
,是因为 0
一定正确,而也有可能 citations[]
中的所有数都 >= n
,例如 [6, 6, 6]
这种情况。
根据循环不变量,循环退出时 right = left
均表示第一个不满足要求的下标值。因为满足要求的一定是按照 [y, y, y, y, n, n, n]
这样分布的。
C++ 代码
cpp
class Solution {
public:
int hIndex(vector<int>& citations) {
int n = citations.size();
int left = 1;
int right = n + 1;
while (left < right) {
int mid = (left + right) / 2;
if (citations[n - mid] >= mid) {
left = mid + 1;
}
else {
right = mid;
}
}
return right - 1;
}
};