大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案

上傳人：唯*** IP屬地：河北上傳時(shí)間：2025-02-15 格式：PDF 頁(yè)數(shù)：29 大小：4.72MB 積分：12 舉報(bào) 版權(quán)申訴

大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第2頁(yè)

大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第3頁(yè)

大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第4頁(yè)

大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第5頁(yè)

已閱讀5頁(yè)，還剩24頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

______________________________________________________

大數(shù)據(jù)技術(shù)原理與應(yīng)用

第1章大數(shù)據(jù)概述

1單選（2分）

第三次信息化浪潮的標(biāo)志是：

A.個(gè)人電腦的普及

B.云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的普及

C.虛擬現(xiàn)實(shí)技術(shù)的普及

D.互聯(lián)網(wǎng)的普及

正確答案：B你選對(duì)了

2單選（2分）

就數(shù)據(jù)的量級(jí)而言，1PB數(shù)據(jù)是多少TB?

A.2048

B.1000

C.512

D.1024

正確答案：D你選對(duì)了

3單選（2分）

以下關(guān)于云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)之間的關(guān)系，論述錯(cuò)誤的是：

A.云計(jì)算側(cè)重于數(shù)據(jù)分析

B.物聯(lián)網(wǎng)可以借助于云計(jì)算實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)

C.物聯(lián)網(wǎng)可以借助于大數(shù)據(jù)實(shí)現(xiàn)海量數(shù)據(jù)的分析

D.云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)三者緊密相關(guān)，相輔相成

正確答案：A你選對(duì)了

4單選（2分）

以下哪個(gè)不是大數(shù)據(jù)時(shí)代新興的技術(shù)：

A.Spark

B.Hadoop

C.HBase

D.MySQL

正確答案：D你選對(duì)了

5單選（2分）

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于批處理的:

A.MapReduce

B.DremeI

C.Storm

D.PregeI

正確答案：A你選對(duì)了

6單選（2分）

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于流計(jì)算的:

A.GraphX

B.S4

C.Impala

D.Hive

正確答案：B你選對(duì)了

7單選（2分）

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于圖計(jì)算的:

A.PregeI

B.Storm

C.Cassandra

D.FIume

正確答案：A你選對(duì)了

8單選（2分）

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于查詢分析計(jì)算的

A.HDFS

B.S4

C.DremeI

D.MapReduce

正確答案：C你選對(duì)了

9多選（3分）

數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了三個(gè)階段，包括:

A.運(yùn)營(yíng)式系統(tǒng)階段

B.感知式系統(tǒng)階段

C.移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)階段

D.用戶原創(chuàng)內(nèi)容階段

正確答案：ABD你選對(duì)了

10多選（3分）

大數(shù)據(jù)發(fā)展的三個(gè)階段是：

A.低谷期

B.成熟期

C.大規(guī)模應(yīng)用期

D.萌芽期

正確答案：BCD你選對(duì)了

11多選（3分）

大數(shù)據(jù)的特性包括：

A.價(jià)值密度低

B.處理速度快

C.數(shù)據(jù)類型繁多

D.數(shù)據(jù)量大

正確答案：ABCD你選對(duì)了

12多選（3分）

圖領(lǐng)獎(jiǎng)獲得者、著名數(shù)據(jù)庫(kù)專家JimGray博士認(rèn)為，人類自古以來(lái)在科學(xué)研究上先后經(jīng)歷了哪幾種

范式：

A.計(jì)算科學(xué)

B.數(shù)據(jù)密集型科學(xué)

C.實(shí)驗(yàn)科學(xué)

D.理論科學(xué)

正確答案：ABCD你選對(duì)了

13多選（3分）

大數(shù)據(jù)帶來(lái)思維方式的三個(gè)轉(zhuǎn)變是：

A.效率而非精確

B相關(guān)而非因果

C.精確而非全面

D.全樣而非抽樣

正確答案：ABD你選對(duì)了

14多選（3分）

大數(shù)據(jù)主要有哪幾種計(jì)算模式：

A.流計(jì)算

B.圖計(jì)算

C.查詢分析計(jì)算

D.批處理計(jì)算

正確答案：ABCD你選對(duì)了

15多選（3分）

云計(jì)算的典型服務(wù)模式包括三種：

A.SaaS

B.laaS

C.MaaS

D.PaaS

正確答案：ABD你選對(duì)了

第2章大數(shù)據(jù)處理架構(gòu)Hadoop

1單選（2分）

啟動(dòng)hadoop所有進(jìn)程的命令是：

A.start-dfs.sh

B.start-aII.sh

C.start-hadoop.sh

D.start-hdfs.sh

正確答案：B你選對(duì)了

2單選（2分）

以下對(duì)Hadoop的說(shuō)法錯(cuò)誤的是：

A.Hadoop是基于Java語(yǔ)言開(kāi)發(fā)的，只支持Java語(yǔ)言編程

B.Hadoop2.0增加了NameNodeHA和Wire-compatibiIity兩個(gè)重大特性

C.HadoopMapReduce是針對(duì)谷歌MapReduce的開(kāi)源實(shí)現(xiàn)，通常用于大規(guī)模數(shù)據(jù)集的并行計(jì)算

D.Hadoop的核心是HDFS和MapReduce

正確答案：A你選對(duì)了

3單選（2分）

以下哪個(gè)不是Hadoop的特性：

A.成本高

B.支持多種編程語(yǔ)言

C.高容錯(cuò)性

D.高可靠性

正確答案：A你選對(duì)了

4單選（2分）

以下名詞解釋不正確的是：

A.Zookeeper:針對(duì)谷歌Chubby的一個(gè)開(kāi)源實(shí)現(xiàn)，是高效可靠的協(xié)同工作系統(tǒng)

B.HBase：提供高可靠性、高性能、分柞式的行式數(shù)據(jù)庫(kù)，是谷歌BigTable的開(kāi)源實(shí)現(xiàn)

C.Hive:一個(gè)基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)工具，用于對(duì)Hadoop文件中的數(shù)據(jù)集進(jìn)行數(shù)據(jù)整理、特殊查詢

和分析存儲(chǔ)

D.HDFS:分布式文件系統(tǒng)，是Hadoop項(xiàng)目的兩大核心之一，是谷歌GFS的開(kāi)源實(shí)現(xiàn)

正確答案：B你選對(duì)了

5多選（3分）

以下哪些組件是Hadoop的生態(tài)系統(tǒng)的組件：

A.HBase

B.OracIe

C.HDFS

D.MapReduce

正確答案：ACD你選對(duì)了

6多選（3分）

以下哪個(gè)命令可以用來(lái)操作HDFS文件：

A.hadoopfs

B.hadoopdfs

C.hdfsfs

D.hdfsdfs

正確答案：ABD你選對(duì)了

第3章分布式文件系統(tǒng)HDFS

1單選（2分）

HDFS的合名空間不包含：

A.字節(jié)

B.文件

C.塊

D.目錄

正確答案：A你選對(duì)了

2單選（2分）

對(duì)HDFS通信協(xié)議的理解錯(cuò)誤的是：

A.客戶端與數(shù)據(jù)節(jié)點(diǎn)的交互是通過(guò)RPC（RemoteProcedureCall）來(lái)實(shí)現(xiàn)的

B.客戶端通過(guò)一個(gè)可配置的端口向名稱節(jié)點(diǎn)主動(dòng)發(fā)起TCP連接，并使用客戶端協(xié)議與名稱節(jié)點(diǎn)進(jìn)行交

互

C.名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)之間則使用數(shù)據(jù)節(jié)點(diǎn)協(xié)議進(jìn)行交互

D.HDFS通信協(xié)議都是構(gòu)建在loT協(xié)議基礎(chǔ)之上的

正確答案：D你選對(duì)了

3單選（2分）

采用多副本冗余存儲(chǔ)的優(yōu)勢(shì)不包含：

A.保證數(shù)據(jù)可靠性

B.容易檢查數(shù)據(jù)錯(cuò)誤

C.加快數(shù)據(jù)傳輸速度

D.節(jié)約存儲(chǔ)空間

正確答案：D你選對(duì)了

4單選（2分）

假設(shè)已經(jīng)配置好環(huán)境變量，啟動(dòng)Hadoop和關(guān)閉Hadoop的命令分別是：

A.start-dfs.sh,stop-hdfs.sh

B.start-hdfs.sh,stop-hdfs.sh

C.start-dfs.sh,stop-dfs.sh

D.start-hdfs.sh,stop-dfs.sh

正確答案：C你選對(duì)了

5單選（2分）

分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型，由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的，這些節(jié)點(diǎn)分為兩類，

一類存儲(chǔ)元數(shù)據(jù)叫，另一類存儲(chǔ)具為數(shù)據(jù)叫：

A.名稱節(jié)點(diǎn)，主節(jié)點(diǎn)

B.從節(jié)點(diǎn)，主節(jié)點(diǎn)

C.名稱節(jié)點(diǎn)，數(shù)據(jù)節(jié)點(diǎn)

D.數(shù)據(jù)節(jié)點(diǎn)，名稱節(jié)點(diǎn)

正確答案：C你選對(duì)了

6單選（2分）

下面關(guān)于分布式文件系統(tǒng)HDFS的描述正確的是：

A.分布式文件系統(tǒng)HDFS是GoogleBigtable的一種開(kāi)源實(shí)現(xiàn)

B.分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS（GoogleFileSystem）的一種開(kāi)源實(shí)現(xiàn)

C.分布式文件系統(tǒng)HDFS比較適合存儲(chǔ)大量零碎的小文件

D.分布式文件系統(tǒng)HDFS是一種關(guān)系型數(shù)據(jù)庫(kù)

正確答案：B你選對(duì)了

7多選（3分）

以下對(duì)名稱節(jié)點(diǎn)理解正確的是：

A.名稱節(jié)點(diǎn)作為中心服務(wù)器，負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)

B.名稱節(jié)點(diǎn)用來(lái)負(fù)責(zé)具體用戶數(shù)據(jù)的存儲(chǔ)

C.名稱節(jié)點(diǎn)通常用來(lái)保存元數(shù)據(jù)

D.名稱節(jié)點(diǎn)的數(shù)據(jù)保存在內(nèi)存中

。確答案：ACD你選對(duì)了

8多選（3分）

以下對(duì)數(shù)據(jù)節(jié)點(diǎn)理解正確的是：

A.數(shù)據(jù)節(jié)點(diǎn)通常只有一個(gè)

B.數(shù)據(jù)節(jié)點(diǎn)用來(lái)存儲(chǔ)具體的文件內(nèi)容

C.數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)保存在磁盤中

D.數(shù)據(jù)節(jié)點(diǎn)在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)夕亍數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作

正確答案：BCD你選對(duì)了

9多選（3分）

HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn)帶來(lái)的局限性包括：

A.集群的可用性

B.性能的瓶頸

C.命名空間的限制

D.隔離問(wèn)題

正確答案：ABCD你選對(duì)了

10多選（3分）

以下HDFS相關(guān)的shelI命令不正確的是：

A.hadoopdfsmkdir<path>:創(chuàng)建<path>指定的文件夾

B.hdfsdfs-rm<path>:刪除路徑32珀>指定的文件

C.hadoopfs-copyFromLocaI<path1><path2>:將路徑<path2>指定的文件或文件夾復(fù)制到路徑

<pathlX旨定的文件夾中

D.hadoopfs-Is＜path＞：顯示＜path＞指定的文件的詳細(xì)信息

正確答案：AC你選對(duì)了

第4章分布式數(shù)據(jù)庫(kù)HBase

1單選（2分）

HBase是一種數(shù)據(jù)庫(kù)

A.行式數(shù)據(jù)庫(kù)

B.關(guān)系數(shù)據(jù)庫(kù)

C.文檔數(shù)據(jù)庫(kù)

D.列式數(shù)據(jù)庫(kù)

正確答案：D你選對(duì)了

2單選（2分）

下列對(duì)HBase數(shù)據(jù)模型的描述錯(cuò)誤的是：

A.每個(gè)HBase表都由若干行組成，每個(gè)年由行鍵（rowkey）來(lái)標(biāo)識(shí)

B.HBase是一個(gè)稀疏、多維度、排序的映射表，這張表的索引是行健、列族、列限定符和時(shí)間戳

C.HBase中執(zhí)行更新操作時(shí)，會(huì)刪除數(shù)據(jù)舊的版本，并生成一個(gè)新的版本

D.HBase列族支持動(dòng)態(tài)擴(kuò)展，可以很輕松地添加一個(gè)列族或列

正確答案：C你選對(duì)了

3單選（2分）

下列說(shuō)法正確的是：

A.如果不啟動(dòng)Hadoop,則HBase完全無(wú)法使用

B.HBase的實(shí)現(xiàn)包括的主要功能組件是庫(kù)函數(shù)，一個(gè)Master主服務(wù)器和一個(gè)Region服務(wù)器

C.如果通過(guò)HBaseShell插入表數(shù)據(jù)，可以插入一行數(shù)據(jù)或一個(gè)單元格數(shù)據(jù)

D.Zookeeper是一個(gè)集群管理工具，常用于分布式計(jì)算，提供配置維護(hù)、域名服務(wù)、分布式同步等

正確答案：D你選對(duì)了

4單選（2分）

在HBase數(shù)據(jù)庫(kù)中，每個(gè)Region的建議最佳大小是：

A.2GB-4GB

B.100MB-200MB

C.500MB-1000MB

D.1GB-2GB

正確答案：D你選對(duì)了

5單選（2分）

HBase三層結(jié)構(gòu)的順序是：

A.Zookeeper文件,.MEATA.表,-ROOT-表

B.-ROOT-表，Zookeeper文件，.MEATA.表

CZookeeper文件,-ROOT-表，.MEATA.表

D..MEATA.表，Zookeeper文件，-ROOT-表

正確答案：C你選對(duì)了

6單選（2分）

客戶端是通過(guò)級(jí)尋址來(lái)定位Region:

A.三

B.二

C.一

D.四

正確答案：A你選對(duì)了

7單選（2分）

關(guān)于HBaseShelI命令解釋錯(cuò)誤的是:

A.create:創(chuàng)建表

B.put:向表、行、列指定的單元格添加數(shù)據(jù)

C.Iist:顯示表的所有數(shù)據(jù)

D.get:通過(guò)表名、行、列、時(shí)間戳、時(shí)間范圍和版本號(hào)來(lái)獲得相應(yīng)單元格的值

正確答案：C你選對(duì)了

8多選（3分）

下列對(duì)HBase的理解正確的是：

A.HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)

B.HBase是一種關(guān)系型數(shù)據(jù)庫(kù)，現(xiàn)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域

C.HBase是一個(gè)行式分布式數(shù)據(jù)庫(kù)，是Hadoop生態(tài)系統(tǒng)中的一個(gè)組件

D.HBase多用于存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)億的松散數(shù)據(jù)

正確答案：AD你選對(duì)了

9多選（3分）

HBase和傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別在于哪些方面：

A.數(shù)據(jù)操作

B.數(shù)據(jù)索引

C.數(shù)據(jù)模型

D.存儲(chǔ)模式

正確答案：ABCD你選對(duì)了

10多選（3分）

訪問(wèn)HBase表中的行，有哪些方式：

A.通過(guò)某列的值區(qū)間

B.全表掃描

C.通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)

D.通過(guò)單個(gè)行健訪問(wèn)

正確答案：BCD你選對(duì)了

第5章NoSQL數(shù)據(jù)庫(kù)

1單選（2分）

下列關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)的比較，不正確的是：

A.NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性，關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性

B.NoSQL數(shù)據(jù)庫(kù)缺乏統(tǒng)一的查詢語(yǔ)言，而關(guān)系型數(shù)據(jù)庫(kù)有標(biāo)準(zhǔn)化查詢語(yǔ)言

C.NoSQL數(shù)據(jù)庫(kù)的可擴(kuò)展性比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)更好

D.NoSQL數(shù)據(jù)庫(kù)具有弱一致性，關(guān)系型數(shù)據(jù)庫(kù)具有強(qiáng)一致性

正確答案：A你選對(duì)了

2單選（2分）

以下對(duì)各類數(shù)據(jù)庫(kù)的理解錯(cuò)誤的是：

A.鍵值數(shù)據(jù)庫(kù)的鍵是一個(gè)字符串對(duì)象，值可以是任意類型的數(shù)據(jù)，比如整型和字符型等

B.文檔數(shù)據(jù)庫(kù)的數(shù)據(jù)是松散的，XML和JS0N文檔等都可以作為數(shù)據(jù)存轉(zhuǎn)在文檔數(shù)據(jù)庫(kù)中

C.圖數(shù)據(jù)庫(kù)靈活性高，支持復(fù)雜的圖算法，可用于構(gòu)建復(fù)雜的關(guān)系圖譜

D.HBase數(shù)據(jù)庫(kù)是列族數(shù)據(jù)庫(kù)，可擴(kuò)展性強(qiáng)，支持事務(wù)一致性

正確答案：D你選對(duì)了

3單選（2分）

下列數(shù)據(jù)庫(kù)屬于文檔數(shù)據(jù)庫(kù)的是：

A.MySQL

B.Redis

C.MongoDB

D.HBase

正確答案：C你選對(duì)了

4單選（2分）

NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括：

A.最終一致性

B.BASE

C.ACID

D.CAP

正確答案：C你選對(duì)了

5多選（3分）

關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)，下列說(shuō)法正確的是：

A.NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ)，具有強(qiáng)大的橫向擴(kuò)展能力

B.NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn)，但隨著NoSQL的發(fā)展，終將取代關(guān)系數(shù)據(jù)庫(kù)

C.大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性

D.關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ)，NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)

正確答案：ACD你選對(duì)了

6多選（3分）

NoSQL數(shù)據(jù)庫(kù)的類型包括：

A.鍵值數(shù)據(jù)庫(kù)

B.列族數(shù)據(jù)庫(kù)

C.文檔數(shù)據(jù)庫(kù)

D.圖數(shù)據(jù)庫(kù)

正確答案：ABCD你選對(duì)了

7多選（3分）

CAP是指：

A.一致性

B.可用性

C.持久性

D.分區(qū)容忍性

正確答案：ABD你選對(duì)了

8多選（3分）

NoSQL數(shù)據(jù)庫(kù)的BASE特性是指：

A.軟狀態(tài)

B.持續(xù)性

C.最終一致性

D.基本可用

正確答案：ACD你選對(duì)了

第6章云數(shù)據(jù)庫(kù)

1單選（2分）

下列Amazon的云數(shù)據(jù)庫(kù)屬于關(guān)系數(shù)據(jù)庫(kù)的是：

A.AmazonSimpleDB

B.AmazonDynamoDB

C.AmazonRDS

D.AmazonRedshift

正確答案：C你選對(duì)了

2單選（2分）

下列關(guān)于UMP系統(tǒng)的說(shuō)法不正確的是：

A.Controller服務(wù)器向UMP集群提供各種管理服務(wù)，實(shí)現(xiàn)集群成員管理、元數(shù)據(jù)存儲(chǔ)等功能

B.Agent服務(wù)器部署在運(yùn)行MySQL進(jìn)程的機(jī)器上，用來(lái)管理每臺(tái)物理機(jī)上的MySQL實(shí)例

C.UMP系統(tǒng)是低成本和高性能的MySQL云數(shù)據(jù)庫(kù)方案

D.Mnesia是UMP系統(tǒng)的一個(gè)組件，是一個(gè)分布式數(shù)據(jù)庫(kù)管理系統(tǒng)，且不支持事務(wù)

正確答案：D你選對(duì)了

3多選（3分）

UMP依賴的開(kāi)源組件包括

A.LVS

B.ZooKeeper

C.Mnesia

D.RabbitMQ

正確答案：ABCD你選對(duì)了

4多選（3分）

在UMP系統(tǒng)中，Zookeeper主要發(fā)揮的作用包括：

A.監(jiān)控所有MySQL實(shí)例

B.負(fù)責(zé)集群負(fù)載均衡

C.提供分布式鎖，選出一個(gè)集群的“總管”

D.作為全局的配置服務(wù)器

正確答案：ACD你選對(duì)了

5多選（3分）

UMP系統(tǒng)設(shè)計(jì)了哪些機(jī)制來(lái)保證數(shù)據(jù)安全:A.記錄用戶操作日志

B.數(shù)據(jù)訪問(wèn)IP白名單

C.SSL數(shù)據(jù)庫(kù)連接

D.SQL攔截

正確答案：ABCD你選對(duì)了

第7章MapReduce

1單選（2分）

下列說(shuō)法錯(cuò)誤的是：

A.Map函數(shù)將輸入的元素轉(zhuǎn)換成<key,value>形式的鍵值對(duì)

B.Hadoop框架是用Java實(shí)現(xiàn)的，MapReduce應(yīng)用程序則一定要用Java來(lái)寫

C.MapReduce框架采用了Master/Slave架構(gòu)，包括一個(gè)Master和若干個(gè)SIave

D.不同的Map任務(wù)之間不能互相通信

正確答案：B你選對(duì)了

2單選（2分）

在使用MapReduce程序WordCount進(jìn)行詞頻統(tǒng)計(jì)時(shí)，對(duì)于文本行"heIIohadoopheIIoworId”,經(jīng)

過(guò)WordCount程序的Map函數(shù)處理后直接輸出的中間結(jié)果，應(yīng)該是下面哪種形式：

A.<"heIIo",1,1>><"hadoop",1>和<"?！窱d”,1>

B.<"hello",2>.<"hadoop",1>^<"worId",1>

C.<"heIIo",<1,1?><"hadoop",1>^<"worId",1>

D.<"hello",1>><"hello",1>.<"hadoop"，1>和<"worId"，1>

正確答案：D你選對(duì)了

3單選（2分）

對(duì)于文本行“hellohadoophelloworld"，經(jīng)過(guò)WordCount的Reduce函數(shù)處理后的結(jié)果是：

A.<"helIo",<1,1?<"hadoop",1><"worId",1>

B.<"helIo",1><"helIo",1><"hadoop",1><"worId",1>

C.<"helIo",1,1><"hadoop",1><"worId",1>

D.<"heIIo",2><"hadoop",1X"worId",1>

正確答案：B你選對(duì)了

4多選（3分）

下列關(guān)于傳統(tǒng)并行計(jì)算框架（比如MPI）和MapReduce并行計(jì)算框架比較正確的是：

A.前者所需硬件價(jià)格貴，可擴(kuò)展性差，后者硬件便宜，擴(kuò)展性好

B.前者相比后者學(xué)習(xí)起來(lái)更難

C.前者是共享式（共享內(nèi)存/共享存儲(chǔ)），容錯(cuò)性差，后者是非共享式的，容錯(cuò)性好

D.前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型，后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型

正確答案：ABCD你選對(duì)了

5多選（3分）

MapReducel.0的體系結(jié)構(gòu)主要由哪幾個(gè)部分組成：

A.JobTracker

B.TaskTracker

C.Client

D.Task

正確答案：ABCD你選對(duì)了

第8章Hadoop再探討

1單選（2分）

下列說(shuō)法正確的是：

A.HDFSHA可用性不好

B.第二名稱節(jié)點(diǎn)是熱備份

C.HDFSHA提供高可用性，可以實(shí)現(xiàn)可擴(kuò)展性、系統(tǒng)性能和隔離性

D.第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題

正確答案：D你選對(duì)了

2單選（2分）

HDFSFederation設(shè)計(jì)不能解決“單名稱節(jié)點(diǎn)”存在的哪個(gè)問(wèn)題：

A.單點(diǎn)故障問(wèn)題

B.HDFS集群擴(kuò)展性

C.性能更高效

D.良好的隔離性

正確答案：A你選對(duì)了

3多選（3分）

下列哪些是HadoopL0存在的問(wèn)題：

A.抽象層次低

B.表達(dá)能力有限

C.開(kāi)發(fā)者自己管理作業(yè)之間的依賴關(guān)系

D.執(zhí)行迭代操作效率低

正確答案：ABCD你選對(duì)了

4多選（3分）

下列對(duì)Hadoop各組件的理解正確的是：

A.Oozie:工作流和協(xié)作服務(wù)引擎

B.Pig:處理大規(guī)模數(shù)據(jù)的腳本語(yǔ)言

C.Kafka:分布式發(fā)布訂閱消息系統(tǒng)

D.Tez:支持DAG作業(yè)的計(jì)算框架

正確答案：ABCD你選對(duì)了

5多選（3分）

對(duì)新一代資源管理調(diào)度框架YARN的理解正確的是：

A.YARN既是資源管理調(diào)度框架，也是一個(gè)計(jì)算框架

B.MapReduce2.0是運(yùn)行在YARN之上的計(jì)算框架，由YARN來(lái)為MapReduce提供資源管理調(diào)度服務(wù)

C.YARN可以實(shí)現(xiàn)“一個(gè)集群多個(gè)框架”，即在一個(gè)集群上部署一個(gè)統(tǒng)一的資源調(diào)度管理框架

D.YARN的體系結(jié)構(gòu)包含三個(gè)組件：ResourceManager,NodeManager,ApplicationMaster

正確答案：BCD你選對(duì)了

第9章數(shù)據(jù)倉(cāng)庫(kù)Hive

1單選（2分）

下列有關(guān)Hive和ImpaIa的對(duì)比錯(cuò)誤的是:

A.Hive與Impala中對(duì)SQL的解釋處理匕較相似，都是通過(guò)詞法分析生成執(zhí)行計(jì)劃

B.Hive與Impala使用相同的元數(shù)據(jù)

C.Hive適合于長(zhǎng)時(shí)間的批處理查詢分析，而Impala適合于實(shí)時(shí)交互式SQL查詢

D.Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí)，會(huì)使用外存，而Impala也是如此

正確答案：D你選對(duì)了

2單選（2分）

下列關(guān)于Hive基本操作命令的解釋錯(cuò)誤的是：

A.createtableifnotexistsusr（idbigint,namestring,ageint）;//如果usr表不存在，創(chuàng)建

表usr,含三個(gè)屬性id,name,age

B.loaddataIocaIinpathVusr/local/data*overwriteintotabIeusr;//才巴目

錄'/usr/1ocaI/data'下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進(jìn)usr表

C.createdatabaseuserdb;//創(chuàng)建數(shù)據(jù)庫(kù)userdb

________________________________________________________

D.insertoverwritetablestudentselect*fromuserwhereage>10;//向表usr1中插入來(lái)自

usr表的age大于10的數(shù)據(jù)并覆蓋student表中原有數(shù)據(jù)

正確答案：B你選對(duì)了

3多選（3分）

下列說(shuō)法正確的是：

A.ImpaIa和Hive、HDFS^HBase等工具可以統(tǒng)一部署在一個(gè)Hadoop平臺(tái)上

B.數(shù)據(jù)倉(cāng)庫(kù)Hive不需要借助于HDFS就可以完成數(shù)據(jù)的存儲(chǔ)

C.Hive本身不存儲(chǔ)和處理數(shù)據(jù)，依賴HDFS存儲(chǔ)數(shù)據(jù)，依賴MapReduce處理數(shù)據(jù)

D.HiveQL語(yǔ)法與傳統(tǒng)的SQL語(yǔ)法很相似

正確答案：ACD你選對(duì)了

4多選（3分）

ImpaIa主要由哪幾個(gè)部分組成：

A.Hive

B.Impalad

C.StateStore

D.CLI

正確答案：BCD你選對(duì)了

5多選（3分）

以下屬于Hive的基本數(shù)據(jù)類型是：

A.BINARY

B.STRING

C.FLOAT

D.TINYINT

正確答案：ABCD你選對(duì)了

第10章Spark

1單選（2分）

SparkSQL目前暫時(shí)不支持下列哪種語(yǔ)言：

A.Python

B.Java

C.SeaIa

D.Lisp

正確答案：D你選對(duì)了

2單選(2分)

RDD操作分為轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類型，下列屬于動(dòng)作(Action)類型的

操作的是：

A.groupBy

B.fiIter

C.count

D.map

正確答案：C你選對(duì)了

3單選(2分)

下列說(shuō)法錯(cuò)誤的是：

A.在選擇SparkStreaming和Storm時(shí)，對(duì)實(shí)時(shí)性要求高(比如要求毫秒級(jí)響應(yīng))的企業(yè)更傾向于選

擇流計(jì)算框架Storm

B.RDD采用情性調(diào)用，遇到“轉(zhuǎn)換(Transformation)”類型的操作時(shí)，只會(huì)記錄RDD生成的軌跡，只

有遇到“動(dòng)作(Action)”類型的操作時(shí)才會(huì)觸發(fā)真正的計(jì)算

C.Spark支持三種類型的部署方式：StandaIone,SparkonMesos,SparkonYARN

D.RDD提供的轉(zhuǎn)換接口既適用fiIter等粗粒度的轉(zhuǎn)換，也適合某一數(shù)據(jù)項(xiàng)的細(xì)粒度轉(zhuǎn)換

正確答案：D你選對(duì)了

4單選(2分)

下列關(guān)于常見(jiàn)的動(dòng)作(Action)和轉(zhuǎn)換(Transformation)操作的API解釋錯(cuò)誤的是：

A.fiIter(func):篩選出滿足函數(shù)func的元素，并返回一個(gè)新的數(shù)據(jù)集

B.map(func):將每個(gè)元素傳遞到函數(shù)func中，并將結(jié)果返回為一個(gè)新的數(shù)據(jù)集

C.count{):返回?cái)?shù)據(jù)集中的元素個(gè)數(shù)

D.take(n):返回?cái)?shù)據(jù)集中的第n個(gè)元素

正確答案：D你選對(duì)了

5單選(2分)

下列大數(shù)據(jù)處理類型與其對(duì)應(yīng)的軟件框架不匹配的是：

A.復(fù)雜的批量數(shù)據(jù)處理：MapReduce

B.基于歷史數(shù)據(jù)的交互式查詢：Impala

C.基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理：Storm

D.圖結(jié)構(gòu)數(shù)據(jù)的計(jì)算：Hive

正確答案：D你選對(duì)了

6多選(3分)

Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目包括：

A.Oracle

B.Hadoop

C.Storm

D.Spark

正確答案：ABC你選對(duì)了

7多選（3分）

Spark的主要特點(diǎn)包括：

A.運(yùn)行模式多樣

B.運(yùn)行速度快

C.通用性好

D.容易使用

。確答案：ABCD你選對(duì)了

8多選（3分）

下列關(guān)于Scala的說(shuō)法正確的是：

A.SeaIa運(yùn)行于Java平臺(tái)，兼容現(xiàn)有的Java程序

B.Scala具備強(qiáng)大的并發(fā)性，支持函數(shù)式編程

C.Seala是一種多范式編程語(yǔ)言

D.Scala是Spark的主要編程語(yǔ)言，但Spark還支持Java、Python>R作為編程語(yǔ)言

正確答案：ABCD你選對(duì)了

9多選（3分）

Spark的運(yùn)行架構(gòu)包括：

A.運(yùn)行作業(yè)任務(wù)的工作節(jié)點(diǎn)WorkerNode

B.每個(gè)工作節(jié)點(diǎn)上負(fù)責(zé)具體任務(wù)的執(zhí)行進(jìn)程Executor

C.每個(gè)應(yīng)用的任務(wù)控制節(jié)點(diǎn)Driver

D.集群資源管理器ClusterManager

正確答案：ABCD你選對(duì)了

第11章流計(jì)算

1單選（2分）

流計(jì)算秉承一個(gè)基本理念，即數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而，如用戶點(diǎn)擊流:

A.降低

B.不確定

0.不變

D.升高

正確答案：A你選對(duì)了

2單選（2分）

Hadoop運(yùn)行的是MapReduce任務(wù)，類似地，Storm運(yùn)行的任務(wù)叫做

A.Spout

B.Bolt

C.Tuple

D.Topology

正確答案：D你選對(duì)了

3多選（3分）

對(duì)于一個(gè)流計(jì)算系統(tǒng)來(lái)說(shuō)，它應(yīng)達(dá)到如下哪些需求：

A.海量式

B.高性能

C.分布式

D.實(shí)時(shí)性

正確答案：A、B、C、D你選對(duì)了

4多選（3分）

數(shù)據(jù)采集系統(tǒng)的基本架構(gòu)包括哪些部分：

A.Controller

B.Store

C.Agent

D.ColIector

正確答案：B、C、D你選對(duì)了

5多選（3分）

以下哪些是開(kāi)源的流計(jì)算框架：

A.FacebookPuma

B.Yahoo!S4

C.IBMInfoSphereStreams

D.TwitterStorm

正確答案：B、D你選對(duì)了

6多選（3分）

下面哪幾個(gè)屬于Storm中的StreamGroupings的分組方式：

A.按照字段分組

B.廣播發(fā)送

C.隨機(jī)分組

D.全局分組

正確答案：A、B、C、D你選對(duì)了

第12章Flink

1單選（2分）

以下哪個(gè)不是Flink的優(yōu)勢(shì)：

A.同時(shí)支持高吞吐、低延遲、高性能

B.不支持增量迭代

C.同時(shí)支持流處理和批處理

D.支持有狀態(tài)計(jì)算

正確答案：B你選對(duì)了

2單選（2分）

在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù)：

A.SQL&Table庫(kù)

B.FlinkML

C.Gelly

D.CEP

正確答案：C你選對(duì)了

3多選（3分）

下面關(guān)于Flink的說(shuō)法正確的是：

A.FIink起源于Stratosphere項(xiàng)目，該項(xiàng)目是在2010年到2014年間由柏林工業(yè)大學(xué)、柏林洪堡大

學(xué)和哈索普拉特納研究所聯(lián)合開(kāi)展的

B.Flink可以同時(shí)支持實(shí)時(shí)計(jì)算和批量計(jì)算

C.FIink不是Apache軟件基金會(huì)的項(xiàng)目

D.FIink是Apache軟件基金會(huì)的5個(gè)最大的大數(shù)據(jù)項(xiàng)目之一

正確答案：A、B、D你選對(duì)了

4多選（3分）

Flink的主要特性包括：

A.精確一次的狀態(tài)一致性保障

B.批流一體化

C.精密的狀態(tài)管理

D.事件時(shí)間支持

正確答案：A、B、C、D你選對(duì)了

5多選（3分）

下面論述正確的是：

A.SparkStreaming通過(guò)采用微批處理方法實(shí)現(xiàn)了高吞吐和容錯(cuò)性，但是犧牲了低延遲和實(shí)時(shí)處理能

力

B.Storm雖然可以做到低延遲，但是無(wú)法實(shí)現(xiàn)高吞吐，也不能在故障發(fā)生時(shí)準(zhǔn)確地處理計(jì)算狀態(tài)

C.流處理架構(gòu)需要具備低延遲、高吞吐和高性能的特性，而目前從市場(chǎng)上已有的產(chǎn)品來(lái)看，只有Flink

可以滿足要求

D.Flink實(shí)現(xiàn)了GoogleDataflow流計(jì)算模型，是一種兼具高吞時(shí)、低延遲和高性能的實(shí)時(shí)流計(jì)算框

架，并且同時(shí)支持批處理和流處理

正確答案：A、B、C、D你選對(duì)了

6多選（3分）

Flink常見(jiàn)的應(yīng)用場(chǎng)景包括：

A.數(shù)據(jù)流水線應(yīng)用

B.事件驅(qū)動(dòng)型應(yīng)用

C.地圖應(yīng)用

D.數(shù)據(jù)分析應(yīng)用

正確答案：A、B、D你選對(duì)了

7多選（3分）

Flink核心組件棧分為哪三層：

A.物理部署層

B.Runtime核心層

C.Core層

D.API&Libraries層

正確答案：A、B、D你選對(duì)了

8多選（3分）

Flink有哪幾種部署模式:

A.運(yùn)行在GCE（谷歌云服務(wù)）和EC2（亞馬遜云服務(wù)）上

B.YARN集群模式

C.StandaIone集群模式

D.Local模式

正確答案：A、B、C、D你選對(duì)了

9多選（3分）

Flink系統(tǒng)主要由兩個(gè)組件組成，分別為：

A.JobManager

B.JobScheduIer

C.TaskScheduler

D.TaskManager

正確答案：A、D你選對(duì)了

10多選（3分）

在編程模型方面，F(xiàn)link提供了不同級(jí)別的抽象，以開(kāi)發(fā)流或批處理作業(yè)，主要包括哪幾個(gè)級(jí)別的抽

象：

A.DataStreamAPI（有界或無(wú)界流數(shù)據(jù)）以及DataSetAPI（有界數(shù)據(jù)集）

B.TableAPI

C.狀態(tài)化的數(shù)據(jù)流接口

D.SQL

正確答案：A、B、C、D你選對(duì)了

第13章圖計(jì)算

1單選（2分）

Pregel是一種基于模型實(shí)現(xiàn)的并行圖處理系統(tǒng):

A.TSP

B.STP

C.BSP

D.SBP

正確答案：C你選對(duì)了

2單選（2分）

谷歌在后Hadoop時(shí)代的新“三駕馬車”不包括:

A.Caffeine

B.DremeI

C.Pregel

D.Hama

正確答案：D你選對(duì)了

3多選（3分）

下列哪些是以圖頂點(diǎn)為中心的，基于消息傳遞批處理的并行圖計(jì)算框架:

A.Hama

B.Giraph

C.PregeI

D.Neo4j

正確答案：A、B、C你選對(duì)了

4多選（3分）

以下關(guān)于Pregel圖計(jì)算框架說(shuō)法正確的是：

A.通常只對(duì)滿足交換律和結(jié)合律的操作才會(huì)開(kāi)啟Combiner功能

B.Pregel采用檢查點(diǎn)機(jī)制來(lái)實(shí)現(xiàn)容錯(cuò)

C.對(duì)于全局拓?fù)涓淖儯琍regel采用了惰性協(xié)調(diào)機(jī)制

D.Aggregator提供了一種全局通信、監(jiān)控和數(shù)據(jù)查看的機(jī)制

正確答案：A、B、C、D你選對(duì)了

第14章大數(shù)據(jù)在不同領(lǐng)域的應(yīng)用

1單選（2分）

下列說(shuō)法錯(cuò)誤的是：

A.ItemCF算法推薦的是那些和目標(biāo)用戶之前喜歡的物品類似的其他物品

B.基于用戶的協(xié)同過(guò)濾算法（簡(jiǎn)稱UserCF算法）是目前業(yè)界應(yīng)用最多的算法

C.UserCF算法推薦的是那些和目標(biāo)用戶有共同興趣愛(ài)好的其他用戶所喜歡的物品

D.UserCF算法的推薦更偏向社會(huì)化，而ItemCF算法的推薦更偏向于個(gè)性化

正確答案：B你選對(duì)了

2多選（3分）

推薦方法包括哪些類型：

A.專家推薦

B.協(xié)同過(guò)濾推薦

C.基于內(nèi)容的推薦

D.基于統(tǒng)計(jì)的推薦

正確答案：A、B、C、D你選對(duì)了

期末試卷

1單選（2分）

數(shù)據(jù)產(chǎn)生方式的變革主要經(jīng)歷了三個(gè)階段，以下哪個(gè)不屬于這三個(gè)階段：

A.運(yùn)營(yíng)式系統(tǒng)階段

B.感知式系統(tǒng)階段

C.數(shù)據(jù)流階段

D.用戶原創(chuàng)內(nèi)容階段

正確答案：C你選對(duì)了

2單選（2分）

第三次信息化浪潮的發(fā)生標(biāo)志是以下哪種技術(shù)的普及：

A.互聯(lián)網(wǎng)

B.CPU

C.物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)

D.個(gè)人計(jì)算機(jī)

正確答案：C你選對(duì)了

3單選（2分）

在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù)：

A.SQL&Table庫(kù)

B.CEP

C.Geliy

D.FlinkML

正確答案：C你選對(duì)了

4單選（2分）

Hadoop的兩大核心是和

A.MapReduce;HBase

B.HDFS;HBase

C.HDFS;MapReduce

D.GFS;MapReduce

正確答案：C你選對(duì)了

5單選（2分）

HDFS默認(rèn)的一個(gè)塊大小是

A.64MB

B.8KB

C.32KB

D.16KB

正確答案：A你選對(duì)了

6單選（2分）

在分布式文件系統(tǒng)HDFS中，負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀?。?/p>

A.數(shù)據(jù)節(jié)點(diǎn)

B.第二名稱節(jié)點(diǎn)

C.名稱節(jié)點(diǎn)

D.主節(jié)點(diǎn)

正確答案：A你選對(duì)了

7單選（2分）

上傳當(dāng)前目錄下的本地文件file,txt到分布式文件系統(tǒng)HDFS的“/path”目錄下的Shell命令是：

A.hdfsdfs-put/pathfile.txt

B.hadoopdfs-put/pathfiIe.txt

C.hdfsfs-putfile.txt/path

D.hdfsdfs-putfile.txt/path

正確答案：D你選對(duì)了

8單選（2分）

在HDFS根目錄下創(chuàng)建一個(gè)文件夾/test,且/test文件夾內(nèi)還包含一個(gè)文件夾dir,正確的shell命令是:

A.hadoopfs-mkdir-p/test/dir

B.hdfsfs-mkdir-p/test/dir

C.hadoopdfs-mkdir/test/dir

D.hdfsdfs*mkdir-p/test/dir

正確答案：A你選對(duì)了

9單選（2分）

下列有關(guān)HBase的說(shuō)法正確的是：

A.在向數(shù)據(jù)庫(kù)中插入記錄時(shí)，HBase和關(guān)系數(shù)據(jù)庫(kù)一樣，每次都是以“行”為單位把整條記錄插入數(shù)據(jù)庫(kù)

B.HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)，是高可靠、高性能的圖數(shù)據(jù)庫(kù)

C.HBase是一種NoSQL數(shù)據(jù)庫(kù)

D.HBase數(shù)據(jù)庫(kù)表可以設(shè)置該表任意列作為索引

正確答案：C你選對(duì)了

10單選（2分）

已知一張表student存儲(chǔ)在HBase中,向表中插入一條記錄{id:2015001,name:Mary,{score:math）：88）,其

id作為行鍵，其中，在插入數(shù)學(xué)成績(jī)88分時(shí)，正確的命令是：

A.put'student','score:math','88'

B.put'student'20150011,'score:math','88'

C.put'student,2015001','math','88'

D.put'student',,2015001','88'

正確答案：B你選對(duì)了

11單選（2分）

NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括：

A.ACID

B.最終一致性

C.BASE

D.CAP

正確答案：A你選對(duì)了

12單選（2分）

在設(shè)計(jì)詞頻統(tǒng)計(jì)的MapReduce程序時(shí)，對(duì)于文本行“helIobigdatahelIohadoop"，經(jīng)過(guò)map函數(shù)處理后直

接輸出的結(jié)果應(yīng)該是（沒(méi)有發(fā)生combine和merge操作）：

A.<"helIo",1,1>、<"bigdata",1>^<Mhadoop",1>

B.<"hello",<1,1?.<"W？<^匕"，1>和<52（100d,1>

C.<"hello",2>、<"bigdata",1>^<"hadoop",1>

D.<"hello",1>.<"hello",1>、<"bigdata",I^Mfadoop”,1>

正確答案：D你選對(duì)了

13單選（2分）

假設(shè)已經(jīng)配置好PATH環(huán)境變量，啟動(dòng)Hadoop的命令是：

A.start-hdfs.sh

B.start-fs.sh

C.start-dfs.sh

D.start-hadoop.sh

正確答案：C你選對(duì)了

14單選（2分）

下列說(shuō)法錯(cuò)誤的是：

A.HDFSFederation使得HDFS的命名服務(wù)能夠水平擴(kuò)展

B.第二名稱節(jié)點(diǎn)是熱備份，而HDFSHA不是熱備份

C.HDFSHA可以解決單點(diǎn)故障問(wèn)題

D.第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題

正確答案：B你選對(duì)了

15單選（2分）

RDD操作包括轉(zhuǎn)換（Transformation）和動(dòng)作（Action）兩種類型，下列RDD操作屬于動(dòng)作（Action）類型的是:

A.join

B.map

C.collect

D.groupBy

正確答案：C你選對(duì)了

16單選（2分）

下列關(guān)于Hive的說(shuō)法正確的是：

A.Hive支持頻繁數(shù)據(jù)更新

B.Hive不支持索引

C.Hive支持批量導(dǎo)入

D.Hive的可擴(kuò)展性差

正確答案：C你選對(duì)了

17多選（3分）

大數(shù)據(jù)的特點(diǎn)包括：

A.數(shù)據(jù)量大

B.處理速度快

C.價(jià)值密度低

D.數(shù)據(jù)種類繁多

正確答案：A、B、C、D你選對(duì)了

18多選（3分）

下列適用于批處理計(jì)算的框架有哪些：

A.PregeI

B.Spark

C.MapReduce

D.Storm

正確答案：B、C你選對(duì)了

19多選（3分）

下列適用于流計(jì)算的框架有哪些：

A.Storm

B.DremeI

C.SparkStreaming

D.PregeI

正確答案：A、C你選對(duì)了

20多選（3分）

Flink核心組件棧分為哪三層：

A.Core層

B.Runtime核心層

C.API&Libraries層

D.物理部署層

正確答案：B、C、D你選對(duì)了

21多選（3分）

從技術(shù)架構(gòu)上來(lái)看，物聯(lián)網(wǎng)可以分為哪幾層：

A.感知層

B.處理層

C.應(yīng)用層

D.網(wǎng)絡(luò)層

正確答案：A、B、C、D你選對(duì)了

22多選（3分）

HBase需要根據(jù)哪些屬性來(lái)唯一地確定一個(gè)單元格（celI）中的某個(gè)版本數(shù)據(jù):

A.行鍵

B.列族

C.列限定符

D.時(shí)間戳

正確答案：A、B、C、D你選對(duì)了

23多選（3分）

典型的NoSQL數(shù)據(jù)庫(kù)的類型包括：

A.鍵值數(shù)據(jù)庫(kù)

B.列族數(shù)據(jù)庫(kù)

C.圖數(shù)據(jù)庫(kù)

D.文檔數(shù)據(jù)庫(kù)

正確答案：A、B、C、D你選對(duì)了

24多選（3分）

CAP是指：

A.持久性

B.可用性

C.一致性

D.分區(qū)容雙性

正確答案：B、C、D你選對(duì)了

25多選（3分）

云計(jì)算主要包括哪

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔