网课铺 2023-10-12 21:29
1.1大数据的定义与特点
1、【单选题】以下关于大数据的特点,叙述错误的是()。
A、速度慢
B、多元、异构
C、数据规模大
D、基于高度分析的新价值
参考答案:A
2、【单选题】在《法华经》中,“那由他”描写的“大”的数量级是()。
A、10^7
B、10^14
C、10^28
D、10^56参考答案:C
3、【多选题】以下选项中,大数据涉及的领域中包括()。
A、社交网络
B、医疗数据
C、计算机艺术
D、医疗数据
参考答案:ABC(D)
4、【多选题】大数据的应用包括()。
A、预测
B、推荐
C、商业情报分析
D、科学研究
参考答案:ABCD
5、【判断题】目前,关于大数据已有公认的确定定义。
参考答案:X
6、【判断题】大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()
参考答案:√
1.2大数据算法(1)
1、【单选题】大数据求解计算问题过程的第三步一般是()。
A、判断可计算否
B、判断能行可计算否
C、算法设计与分析
D、用计算机语言实现算法
参考答案:C
2、【多选题】在大数据求解计算问题中,判断是否为能行可计算的因素包括()。
A、数据量
B、资源约束
C、速度约束
D、时间约束
参考答案:ABD
3、【判断题】大数据求解计算问题过程的第一步是确定该问题是否可计算。
参考答案:√
4、【判断题】大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。
参考答案:√
1.3大数据算法(2)
1、【多选题】资源约束包括()。
A、CPU
B、网络带宽
C、内存
D、外存
参考答案:ABCD
2、【多选题】大数据算法可以不是()。
A、云计算
B、精确算法
C、内存算法
D、串行算法
参考答案:BCD
3、【判断题】大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。
参考答案:X
4、【判断题】MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。
参考答案:√
5、【判断题】大数据算法是仅在电子计算机上运行的算法。
参考答案:X
1.4大数据的特点与大数据算法
1、【单选题】众包算法是用来解决()。
A、访问全部数据时间过长
B、数据难于放入内存计算
C、单个计算机难以保存全部数据,计算需要整体数据
D、计算机计算能力不足或知识不足,需要人来帮忙
参考答案:D
2、【单选题】大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案是()。
A、将数据存储到磁盘上
B、仅基于少量数据进行计算
C、读取部分数据
D、并行处理
参考答案:C
3、【多选题】大数据算法的()特点,使其与大数据算法密切相关的。
A、数据量大
B、基于高度分析的新价值
C、速度快
D、多样性、复杂性
参考答案:AC
4、【判断题】为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。
参考答案:X
1.5大数据算法设计与分析
1、【单选题】大数据算法涉及到外存的时候,通常要分析()。
A、时间空间复杂性
B、IO复杂性
C、结果质量
D、通讯复杂性
参考答案:B
2、【多选题】下列选项中,属于智能仿生算法的是()。
A、遗传算法
B、近似算法
C、模拟退火算法
D、数据流算法
参考答案:AC
3、【判断题】在线算法/数据流算法是面向大数据速度快的特点提出的。()
参考答案:√
4、【判断题】对于数据流算法或在线算法,经常要分析结果的近似比。()
参考答案:X
5、【判断题】随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。()
参考答案:√
2.1亚线性算法的定义
1、【单选题】计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。
A、n²
B、n+1
C、2n
D、n-1参考答案:D
2、【多选题】亚线性是指()等的消耗是输入规模o。()
A、时间
B、空间
C、IO
D、通讯
参考答案:ABCD
3、【判断题】性质检测算法属于亚线性空间算法的一类。()
参考答案:X
2.2水库抽样——空间亚线性算法
1、【判断题】在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量无关。
参考答案:√
2、【判断题】水库抽样算法的采样是均匀的。
参考答案:√
2.3平面图直径——时间亚线性计算算法
1、【单选题】以下()不是衡量分析近似解代价与优化解代价差距的方法。
A、Ratio Bound
B、相对误差
C、绝对误差
D、(1-ℇ)-近似
参考答案:C
2、【单选题】利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。
A、二分之一
B、三分之一
C、四分之一
D、十分之一
参考答案:A
3、【单选题】采用平面图的直径近似算法的动机是无法在要求的时间内得到()。
A、相似解
B、完整解
C、精确解
D、近似解
参考答案:C
4、【判断题】在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。
参考答案:X
5、【判断题】近似算法能给出一个优化问题的优化解。
参考答案:X
6、【判断题】Ratio Bound越大,则近似解越坏。()
参考答案:√
2.4全0数组判定——时间亚线性判定算法
1、【多选题】在判定问题的近似中,对于近似解需要区分的是()。
A、是
B、否
C、差不离
D、差得很远
参考答案:AD
2、【判断题】全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。
参考答案:X
3、【判断题】判定问题的近似解是指:输入满足某种性质或近似满足某种性质。
参考答案:X
3.1数据流中频繁元素
1、【判断题】Zipf原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()
参考答案:X
2、【判断题】在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些函数时通常使用单个寄存器s。()
参考答案:√
3、【判断题】数据流模型中,数据流是指来自某个域中的元素序列。()
参考答案: