题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
解答
1 | ArrayList<Integer> list = new ArrayList<>(); |
官方题解
链接:https://www.nowcoder.com/questionTerminal/9be0172896bd43948f8a32fb954e1be1?answerType=1&f=discussion
来源:牛客网
方法一:暴力方法
对于一组数据,我们可以用vector arr
来存取。如果对vector
排好序,则很容易求出中位数。如果vector
的大小为sz
。
- 如果
sz
为奇数,假如为3,即[0 1 2],
则中位数就是中间的那个数arr[1]
。 - 如果
sz
为偶数,假如为4,即[0 1 2 3],
则中位数就是中间两个数的加权平均数。即(arr[1] + arr[2]) / 2
代码如下:
1 | class Solution { |
时间复杂度:Insert()
为O(1)
,GetMedian()
为O(nlogn)
空间复杂度:O(n)
方法二:插入排序
对于方法一,可以发现有个优化的地方。
方法一中GetMEdian()
操作,是每次都对整个vector
调用排序操作。
但是其实每次都是在一个有序数组中插入一个数据。因此可以用插入排序。
所以:
Insert()
操作可改为插入排序GetMedian()
操作可直接从有序数组中获取中位数
代码如下:
1 | class Solution { |
时间复杂度:Insert()
为O(n)
,即二分查找的O(logn)
和挪动数据的O(n)
, GetMedian()
为O(1)
空间复杂度:O(n)
方法三:堆
中位数是指:有序数组中中间的那个数。则根据中位数可以把数组分为如下三段:[0 ... median - 1], [median], [median ... arr.size() - 1]
,即[中位数的左边,中位数,中位数的右边]
那么,如果我有个数据结构保留[0…median-1]的数据,并且可以O(1)
时间取出最大值,即arr[0...median-1]
中的最大值
相对应的,如果我有个数据结构可以保留[median + 1 ... arr.size() - 1]
的数据, 并且可以O(1)
时间取出最小值,即arr[median + 1 ... arr.size() - 1]
中的最小值。
然后,我们把[median]即中位数,随便放到哪个都可以。
假设[0 ... median - 1]
的长度为l_len
, [median + 1 ... arr.sise() - 1]
的长度为 r_len
.
1.如果l_len == r_len + 1
, 说明,中位数是左边数据结构的最大值
2.如果l_len + 1 == r_len
, 说明,中位数是右边数据结构的最小值
3.如果l_len == r_len
, 说明,中位数是左边数据结构的最大值与右边数据结构的最小值的平均值。
说了这么多,一个数据结构可以O(1)
返回最小值的,其实就是小根堆,O(1)
返回最大值的,其实就是大根堆。并且每次插入到堆中的时间复杂度为O(logn)
所以,GetMedian()
操作算法过程为:
- 初始化一个大根堆,存中位数左边的数据,一个小根堆,存中位数右边的数据
- 动态维护两个数据结构的大小,即最多只相差一个
代码如下:
1 | class Solution { |
时间复杂度:Insert()
为O(logn)
, GetMedian()
为O(1)
空间复杂度:O(n)