求出数组中超过一半的数
Tango 是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在 Tango上面交流灌水。传说,Tango 有一大“水王”,他不但喜欢发贴,还会回复其他 ID 发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的 ID 也在表中,你能快速找出这个传说中的 Tango 水王吗?
创新互联公司主要为客户提供服务项目涵盖了网页视觉设计、VI标志设计、成都全网营销、网站程序开发、HTML5响应式成都网站建设、成都手机网站制作、微商城、网站托管及成都网站改版、WEB系统开发、域名注册、国内外服务器租用、视频、平面设计、SEO优化排名。设计、前端、后端三个建站步骤的完善服务体系。一人跟踪测试的建站服务标准。已经为成都纸箱行业客户提供了网站开发服务。
思路:首先想到的是一个最直接的方法,我们可以对所有 ID 进行排序。然后再扫描一遍排好序的 ID 列表,统计各个 ID 出现的次数。如果某个 ID 出现的次数超过总数的一半,那么就输出这个 ID。这个算法的时间复杂度为 O(N * log2N + N)。如果 ID 列表已经是有序的,还需要扫描一遍整个列表来统计各个 ID 出现的次数吗?
如果一个 ID 出现的次数超过总数 N 的一半。那么,无论水王的 ID 是什么,这个有序的 ID 列表中的第 N/2 项(从 0 开始编号)一定会是这个 ID(读者可以试着证明一下)。省去重新扫描一遍列表, 可以节省一点算法耗费的时间。如果能够迅速定位到列表的某一项 (比如使用数组来存储列表),除去排序的时间复杂度,后处理需要的时间为 O(1)。但上面两种方法都需要先对 ID 列表进行排序,时间复杂度方面没有本质的改进。能否避免排序呢
如果每次删除两个不同的 ID(不管是否包含“水王”的 ID),那么,在剩下的 ID 列表中,“水王”ID 出现的次数仍然超过总数的一半。看到这一点之后, 就可以通过不断重复这个过程,把 ID 列表中的 ID 总数降低(转化为更小的问题),从而得到问题的答案。新的思路,避免了排序这个耗时的步骤,总的时间复杂度只有 O(N),且只需要常数的额外内存。
#includeusing namespace std; //类比为一个数组中超过一半的数,求出这个数 template T Find(T* a,int size) { T ret=-1; int time=0; for(int i=0;i 参照:https://github.com/xiaozhi1995/SmartCode/blob/master/20160511702SearchMidNum/main.cpp
网站栏目:求出数组中超过一半的数
文章位置:http://myzitong.com/article/geisjd.html