大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第1頁(yè)
大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第2頁(yè)
大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第3頁(yè)
大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第4頁(yè)
大學(xué)生mooc大數(shù)據(jù)技術(shù)原理與應(yīng)用(林子雨)章節(jié)測(cè)驗(yàn)期末考試答案_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

______________________________________________________

大數(shù)據(jù)技術(shù)原理與應(yīng)用

第1章大數(shù)據(jù)概述

1單選(2分)

第三次信息化浪潮的標(biāo)志是:

A.個(gè)人電腦的普及

B.云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的普及

C.虛擬現(xiàn)實(shí)技術(shù)的普及

D.互聯(lián)網(wǎng)的普及

正確答案:B你選對(duì)了

2單選(2分)

就數(shù)據(jù)的量級(jí)而言,1PB數(shù)據(jù)是多少TB?

A.2048

B.1000

C.512

D.1024

正確答案:D你選對(duì)了

3單選(2分)

以下關(guān)于云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)之間的關(guān)系,論述錯(cuò)誤的是:

A.云計(jì)算側(cè)重于數(shù)據(jù)分析

B.物聯(lián)網(wǎng)可以借助于云計(jì)算實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)

C.物聯(lián)網(wǎng)可以借助于大數(shù)據(jù)實(shí)現(xiàn)海量數(shù)據(jù)的分析

D.云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)三者緊密相關(guān),相輔相成

正確答案:A你選對(duì)了

4單選(2分)

以下哪個(gè)不是大數(shù)據(jù)時(shí)代新興的技術(shù):

A.Spark

B.Hadoop

C.HBase

D.MySQL

正確答案:D你選對(duì)了

1

5單選(2分)

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于批處理的:

A.MapReduce

B.DremeI

C.Storm

D.PregeI

正確答案:A你選對(duì)了

6單選(2分)

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于流計(jì)算的:

A.GraphX

B.S4

C.Impala

D.Hive

正確答案:B你選對(duì)了

7單選(2分)

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于圖計(jì)算的:

A.PregeI

B.Storm

C.Cassandra

D.FIume

正確答案:A你選對(duì)了

8單選(2分)

每種大數(shù)據(jù)產(chǎn)品都有特定的應(yīng)用場(chǎng)景,以下哪個(gè)產(chǎn)品是用于查詢分析計(jì)算的

A.HDFS

B.S4

C.DremeI

D.MapReduce

正確答案:C你選對(duì)了

9多選(3分)

數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了三個(gè)階段,包括:

A.運(yùn)營(yíng)式系統(tǒng)階段

B.感知式系統(tǒng)階段

C.移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)階段

2

D.用戶原創(chuàng)內(nèi)容階段

正確答案:ABD你選對(duì)了

10多選(3分)

大數(shù)據(jù)發(fā)展的三個(gè)階段是:

A.低谷期

B.成熟期

C.大規(guī)模應(yīng)用期

D.萌芽期

正確答案:BCD你選對(duì)了

11多選(3分)

大數(shù)據(jù)的特性包括:

A.價(jià)值密度低

B.處理速度快

C.數(shù)據(jù)類型繁多

D.數(shù)據(jù)量大

正確答案:ABCD你選對(duì)了

12多選(3分)

圖領(lǐng)獎(jiǎng)獲得者、著名數(shù)據(jù)庫(kù)專家JimGray博士認(rèn)為,人類自古以來(lái)在科學(xué)研究上先后經(jīng)歷了哪幾種

范式:

A.計(jì)算科學(xué)

B.數(shù)據(jù)密集型科學(xué)

C.實(shí)驗(yàn)科學(xué)

D.理論科學(xué)

正確答案:ABCD你選對(duì)了

13多選(3分)

大數(shù)據(jù)帶來(lái)思維方式的三個(gè)轉(zhuǎn)變是:

A.效率而非精確

B相關(guān)而非因果

C.精確而非全面

D.全樣而非抽樣

正確答案:ABD你選對(duì)了

14多選(3分)

大數(shù)據(jù)主要有哪幾種計(jì)算模式:

3

A.流計(jì)算

B.圖計(jì)算

C.查詢分析計(jì)算

D.批處理計(jì)算

正確答案:ABCD你選對(duì)了

15多選(3分)

云計(jì)算的典型服務(wù)模式包括三種:

A.SaaS

B.laaS

C.MaaS

D.PaaS

正確答案:ABD你選對(duì)了

第2章大數(shù)據(jù)處理架構(gòu)Hadoop

1單選(2分)

啟動(dòng)hadoop所有進(jìn)程的命令是:

A.start-dfs.sh

B.start-aII.sh

C.start-hadoop.sh

D.start-hdfs.sh

正確答案:B你選對(duì)了

2單選(2分)

以下對(duì)Hadoop的說(shuō)法錯(cuò)誤的是:

A.Hadoop是基于Java語(yǔ)言開(kāi)發(fā)的,只支持Java語(yǔ)言編程

B.Hadoop2.0增加了NameNodeHA和Wire-compatibiIity兩個(gè)重大特性

C.HadoopMapReduce是針對(duì)谷歌MapReduce的開(kāi)源實(shí)現(xiàn),通常用于大規(guī)模數(shù)據(jù)集的并行計(jì)算

D.Hadoop的核心是HDFS和MapReduce

正確答案:A你選對(duì)了

3單選(2分)

以下哪個(gè)不是Hadoop的特性:

A.成本高

B.支持多種編程語(yǔ)言

4

C.高容錯(cuò)性

D.高可靠性

正確答案:A你選對(duì)了

4單選(2分)

以下名詞解釋不正確的是:

A.Zookeeper:針對(duì)谷歌Chubby的一個(gè)開(kāi)源實(shí)現(xiàn),是高效可靠的協(xié)同工作系統(tǒng)

B.HBase:提供高可靠性、高性能、分柞式的行式數(shù)據(jù)庫(kù),是谷歌BigTable的開(kāi)源實(shí)現(xiàn)

C.Hive:一個(gè)基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)工具,用于對(duì)Hadoop文件中的數(shù)據(jù)集進(jìn)行數(shù)據(jù)整理、特殊查詢

和分析存儲(chǔ)

D.HDFS:分布式文件系統(tǒng),是Hadoop項(xiàng)目的兩大核心之一,是谷歌GFS的開(kāi)源實(shí)現(xiàn)

正確答案:B你選對(duì)了

5多選(3分)

以下哪些組件是Hadoop的生態(tài)系統(tǒng)的組件:

A.HBase

B.OracIe

C.HDFS

D.MapReduce

正確答案:ACD你選對(duì)了

6多選(3分)

以下哪個(gè)命令可以用來(lái)操作HDFS文件:

A.hadoopfs

B.hadoopdfs

C.hdfsfs

D.hdfsdfs

正確答案:ABD你選對(duì)了

第3章分布式文件系統(tǒng)HDFS

1單選(2分)

HDFS的合名空間不包含:

A.字節(jié)

B.文件

C.塊

5

D.目錄

正確答案:A你選對(duì)了

2單選(2分)

對(duì)HDFS通信協(xié)議的理解錯(cuò)誤的是:

A.客戶端與數(shù)據(jù)節(jié)點(diǎn)的交互是通過(guò)RPC(RemoteProcedureCall)來(lái)實(shí)現(xiàn)的

B.客戶端通過(guò)一個(gè)可配置的端口向名稱節(jié)點(diǎn)主動(dòng)發(fā)起TCP連接,并使用客戶端協(xié)議與名稱節(jié)點(diǎn)進(jìn)行交

C.名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)之間則使用數(shù)據(jù)節(jié)點(diǎn)協(xié)議進(jìn)行交互

D.HDFS通信協(xié)議都是構(gòu)建在loT協(xié)議基礎(chǔ)之上的

正確答案:D你選對(duì)了

3單選(2分)

采用多副本冗余存儲(chǔ)的優(yōu)勢(shì)不包含:

A.保證數(shù)據(jù)可靠性

B.容易檢查數(shù)據(jù)錯(cuò)誤

C.加快數(shù)據(jù)傳輸速度

D.節(jié)約存儲(chǔ)空間

正確答案:D你選對(duì)了

4單選(2分)

假設(shè)已經(jīng)配置好環(huán)境變量,啟動(dòng)Hadoop和關(guān)閉Hadoop的命令分別是:

A.start-dfs.sh,stop-hdfs.sh

B.start-hdfs.sh,stop-hdfs.sh

C.start-dfs.sh,stop-dfs.sh

D.start-hdfs.sh,stop-dfs.sh

正確答案:C你選對(duì)了

5單選(2分)

分布式文件系統(tǒng)HDFS采用了主從結(jié)構(gòu)模型,由計(jì)算機(jī)集群中的多個(gè)節(jié)點(diǎn)構(gòu)成的,這些節(jié)點(diǎn)分為兩類,

一類存儲(chǔ)元數(shù)據(jù)叫,另一類存儲(chǔ)具為數(shù)據(jù)叫:

A.名稱節(jié)點(diǎn),主節(jié)點(diǎn)

B.從節(jié)點(diǎn),主節(jié)點(diǎn)

C.名稱節(jié)點(diǎn),數(shù)據(jù)節(jié)點(diǎn)

D.數(shù)據(jù)節(jié)點(diǎn),名稱節(jié)點(diǎn)

正確答案:C你選對(duì)了

6單選(2分)

6

下面關(guān)于分布式文件系統(tǒng)HDFS的描述正確的是:

A.分布式文件系統(tǒng)HDFS是GoogleBigtable的一種開(kāi)源實(shí)現(xiàn)

B.分布式文件系統(tǒng)HDFS是谷歌分布式文件系統(tǒng)GFS(GoogleFileSystem)的一種開(kāi)源實(shí)現(xiàn)

C.分布式文件系統(tǒng)HDFS比較適合存儲(chǔ)大量零碎的小文件

D.分布式文件系統(tǒng)HDFS是一種關(guān)系型數(shù)據(jù)庫(kù)

正確答案:B你選對(duì)了

7多選(3分)

以下對(duì)名稱節(jié)點(diǎn)理解正確的是:

A.名稱節(jié)點(diǎn)作為中心服務(wù)器,負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)

B.名稱節(jié)點(diǎn)用來(lái)負(fù)責(zé)具體用戶數(shù)據(jù)的存儲(chǔ)

C.名稱節(jié)點(diǎn)通常用來(lái)保存元數(shù)據(jù)

D.名稱節(jié)點(diǎn)的數(shù)據(jù)保存在內(nèi)存中

。確答案:ACD你選對(duì)了

8多選(3分)

以下對(duì)數(shù)據(jù)節(jié)點(diǎn)理解正確的是:

A.數(shù)據(jù)節(jié)點(diǎn)通常只有一個(gè)

B.數(shù)據(jù)節(jié)點(diǎn)用來(lái)存儲(chǔ)具體的文件內(nèi)容

C.數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)保存在磁盤中

D.數(shù)據(jù)節(jié)點(diǎn)在名稱節(jié)點(diǎn)的統(tǒng)一調(diào)度下進(jìn)夕亍數(shù)據(jù)塊的創(chuàng)建、刪除和復(fù)制等操作

正確答案:BCD你選對(duì)了

9多選(3分)

HDFS只設(shè)置唯一一個(gè)名稱節(jié)點(diǎn)帶來(lái)的局限性包括:

A.集群的可用性

B.性能的瓶頸

C.命名空間的限制

D.隔離問(wèn)題

正確答案:ABCD你選對(duì)了

10多選(3分)

以下HDFS相關(guān)的shelI命令不正確的是:

A.hadoopdfsmkdir<path>:創(chuàng)建<path>指定的文件夾

B.hdfsdfs-rm<path>:刪除路徑32珀>指定的文件

C.hadoopfs-copyFromLocaI<path1><path2>:將路徑<path2>指定的文件或文件夾復(fù)制到路徑

<pathlX旨定的文件夾中

7

D.hadoopfs-Is<path>:顯示<path>指定的文件的詳細(xì)信息

正確答案:AC你選對(duì)了

第4章分布式數(shù)據(jù)庫(kù)HBase

1單選(2分)

HBase是一種數(shù)據(jù)庫(kù)

A.行式數(shù)據(jù)庫(kù)

B.關(guān)系數(shù)據(jù)庫(kù)

C.文檔數(shù)據(jù)庫(kù)

D.列式數(shù)據(jù)庫(kù)

正確答案:D你選對(duì)了

2單選(2分)

下列對(duì)HBase數(shù)據(jù)模型的描述錯(cuò)誤的是:

A.每個(gè)HBase表都由若干行組成,每個(gè)年由行鍵(rowkey)來(lái)標(biāo)識(shí)

B.HBase是一個(gè)稀疏、多維度、排序的映射表,這張表的索引是行健、列族、列限定符和時(shí)間戳

C.HBase中執(zhí)行更新操作時(shí),會(huì)刪除數(shù)據(jù)舊的版本,并生成一個(gè)新的版本

D.HBase列族支持動(dòng)態(tài)擴(kuò)展,可以很輕松地添加一個(gè)列族或列

正確答案:C你選對(duì)了

3單選(2分)

下列說(shuō)法正確的是:

A.如果不啟動(dòng)Hadoop,則HBase完全無(wú)法使用

B.HBase的實(shí)現(xiàn)包括的主要功能組件是庫(kù)函數(shù),一個(gè)Master主服務(wù)器和一個(gè)Region服務(wù)器

C.如果通過(guò)HBaseShell插入表數(shù)據(jù),可以插入一行數(shù)據(jù)或一個(gè)單元格數(shù)據(jù)

D.Zookeeper是一個(gè)集群管理工具,常用于分布式計(jì)算,提供配置維護(hù)、域名服務(wù)、分布式同步等

正確答案:D你選對(duì)了

4單選(2分)

在HBase數(shù)據(jù)庫(kù)中,每個(gè)Region的建議最佳大小是:

A.2GB-4GB

B.100MB-200MB

C.500MB-1000MB

D.1GB-2GB

正確答案:D你選對(duì)了

8

5單選(2分)

HBase三層結(jié)構(gòu)的順序是:

A.Zookeeper文件,.MEATA.表,-ROOT-表

B.-ROOT-表,Zookeeper文件,.MEATA.表

CZookeeper文件,-ROOT-表,.MEATA.表

D..MEATA.表,Zookeeper文件,-ROOT-表

正確答案:C你選對(duì)了

6單選(2分)

客戶端是通過(guò)級(jí)尋址來(lái)定位Region:

A.三

B.二

C.一

D.四

正確答案:A你選對(duì)了

7單選(2分)

關(guān)于HBaseShelI命令解釋錯(cuò)誤的是:

A.create:創(chuàng)建表

B.put:向表、行、列指定的單元格添加數(shù)據(jù)

C.Iist:顯示表的所有數(shù)據(jù)

D.get:通過(guò)表名、行、列、時(shí)間戳、時(shí)間范圍和版本號(hào)來(lái)獲得相應(yīng)單元格的值

正確答案:C你選對(duì)了

8多選(3分)

下列對(duì)HBase的理解正確的是:

A.HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn)

B.HBase是一種關(guān)系型數(shù)據(jù)庫(kù),現(xiàn)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域

C.HBase是一個(gè)行式分布式數(shù)據(jù)庫(kù),是Hadoop生態(tài)系統(tǒng)中的一個(gè)組件

D.HBase多用于存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)億的松散數(shù)據(jù)

正確答案:AD你選對(duì)了

9多選(3分)

HBase和傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的區(qū)別在于哪些方面:

A.數(shù)據(jù)操作

B.數(shù)據(jù)索引

C.數(shù)據(jù)模型

9

D.存儲(chǔ)模式

正確答案:ABCD你選對(duì)了

10多選(3分)

訪問(wèn)HBase表中的行,有哪些方式:

A.通過(guò)某列的值區(qū)間

B.全表掃描

C.通過(guò)一個(gè)行健的區(qū)間來(lái)訪問(wèn)

D.通過(guò)單個(gè)行健訪問(wèn)

正確答案:BCD你選對(duì)了

第5章NoSQL數(shù)據(jù)庫(kù)

1單選(2分)

下列關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系型數(shù)據(jù)庫(kù)的比較,不正確的是:

A.NoSQL數(shù)據(jù)庫(kù)很容易實(shí)現(xiàn)數(shù)據(jù)完整性,關(guān)系型數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性

B.NoSQL數(shù)據(jù)庫(kù)缺乏統(tǒng)一的查詢語(yǔ)言,而關(guān)系型數(shù)據(jù)庫(kù)有標(biāo)準(zhǔn)化查詢語(yǔ)言

C.NoSQL數(shù)據(jù)庫(kù)的可擴(kuò)展性比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)更好

D.NoSQL數(shù)據(jù)庫(kù)具有弱一致性,關(guān)系型數(shù)據(jù)庫(kù)具有強(qiáng)一致性

正確答案:A你選對(duì)了

2單選(2分)

以下對(duì)各類數(shù)據(jù)庫(kù)的理解錯(cuò)誤的是:

A.鍵值數(shù)據(jù)庫(kù)的鍵是一個(gè)字符串對(duì)象,值可以是任意類型的數(shù)據(jù),比如整型和字符型等

B.文檔數(shù)據(jù)庫(kù)的數(shù)據(jù)是松散的,XML和JS0N文檔等都可以作為數(shù)據(jù)存轉(zhuǎn)在文檔數(shù)據(jù)庫(kù)中

C.圖數(shù)據(jù)庫(kù)靈活性高,支持復(fù)雜的圖算法,可用于構(gòu)建復(fù)雜的關(guān)系圖譜

D.HBase數(shù)據(jù)庫(kù)是列族數(shù)據(jù)庫(kù),可擴(kuò)展性強(qiáng),支持事務(wù)一致性

正確答案:D你選對(duì)了

3單選(2分)

下列數(shù)據(jù)庫(kù)屬于文檔數(shù)據(jù)庫(kù)的是:

A.MySQL

B.Redis

C.MongoDB

D.HBase

正確答案:C你選對(duì)了

10

4單選(2分)

NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括:

A.最終一致性

B.BASE

C.ACID

D.CAP

正確答案:C你選對(duì)了

5多選(3分)

關(guān)于NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù),下列說(shuō)法正確的是:

A.NoSQL數(shù)據(jù)庫(kù)可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ),具有強(qiáng)大的橫向擴(kuò)展能力

B.NoSQL數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)各有優(yōu)缺點(diǎn),但隨著NoSQL的發(fā)展,終將取代關(guān)系數(shù)據(jù)庫(kù)

C.大多數(shù)NoSQL數(shù)據(jù)庫(kù)很難實(shí)現(xiàn)數(shù)據(jù)完整性

D.關(guān)系數(shù)據(jù)庫(kù)有關(guān)系代數(shù)理論作為基礎(chǔ),NoSQL數(shù)據(jù)庫(kù)沒(méi)有統(tǒng)一的理論基礎(chǔ)

正確答案:ACD你選對(duì)了

6多選(3分)

NoSQL數(shù)據(jù)庫(kù)的類型包括:

A.鍵值數(shù)據(jù)庫(kù)

B.列族數(shù)據(jù)庫(kù)

C.文檔數(shù)據(jù)庫(kù)

D.圖數(shù)據(jù)庫(kù)

正確答案:ABCD你選對(duì)了

7多選(3分)

CAP是指:

A.一致性

B.可用性

C.持久性

D.分區(qū)容忍性

正確答案:ABD你選對(duì)了

8多選(3分)

NoSQL數(shù)據(jù)庫(kù)的BASE特性是指:

A.軟狀態(tài)

B.持續(xù)性

C.最終一致性

11

D.基本可用

正確答案:ACD你選對(duì)了

第6章云數(shù)據(jù)庫(kù)

1單選(2分)

下列Amazon的云數(shù)據(jù)庫(kù)屬于關(guān)系數(shù)據(jù)庫(kù)的是:

A.AmazonSimpleDB

B.AmazonDynamoDB

C.AmazonRDS

D.AmazonRedshift

正確答案:C你選對(duì)了

2單選(2分)

下列關(guān)于UMP系統(tǒng)的說(shuō)法不正確的是:

A.Controller服務(wù)器向UMP集群提供各種管理服務(wù),實(shí)現(xiàn)集群成員管理、元數(shù)據(jù)存儲(chǔ)等功能

B.Agent服務(wù)器部署在運(yùn)行MySQL進(jìn)程的機(jī)器上,用來(lái)管理每臺(tái)物理機(jī)上的MySQL實(shí)例

C.UMP系統(tǒng)是低成本和高性能的MySQL云數(shù)據(jù)庫(kù)方案

D.Mnesia是UMP系統(tǒng)的一個(gè)組件,是一個(gè)分布式數(shù)據(jù)庫(kù)管理系統(tǒng),且不支持事務(wù)

正確答案:D你選對(duì)了

3多選(3分)

UMP依賴的開(kāi)源組件包括

A.LVS

B.ZooKeeper

C.Mnesia

D.RabbitMQ

正確答案:ABCD你選對(duì)了

4多選(3分)

在UMP系統(tǒng)中,Zookeeper主要發(fā)揮的作用包括:

A.監(jiān)控所有MySQL實(shí)例

B.負(fù)責(zé)集群負(fù)載均衡

C.提供分布式鎖,選出一個(gè)集群的“總管”

D.作為全局的配置服務(wù)器

正確答案:ACD你選對(duì)了

12

5多選(3分)

UMP系統(tǒng)設(shè)計(jì)了哪些機(jī)制來(lái)保證數(shù)據(jù)安全:A.記錄用戶操作日志

B.數(shù)據(jù)訪問(wèn)IP白名單

C.SSL數(shù)據(jù)庫(kù)連接

D.SQL攔截

正確答案:ABCD你選對(duì)了

第7章MapReduce

1單選(2分)

下列說(shuō)法錯(cuò)誤的是:

A.Map函數(shù)將輸入的元素轉(zhuǎn)換成<key,value>形式的鍵值對(duì)

B.Hadoop框架是用Java實(shí)現(xiàn)的,MapReduce應(yīng)用程序則一定要用Java來(lái)寫

C.MapReduce框架采用了Master/Slave架構(gòu),包括一個(gè)Master和若干個(gè)SIave

D.不同的Map任務(wù)之間不能互相通信

正確答案:B你選對(duì)了

2單選(2分)

在使用MapReduce程序WordCount進(jìn)行詞頻統(tǒng)計(jì)時(shí),對(duì)于文本行"heIIohadoopheIIoworId”,經(jīng)

過(guò)WordCount程序的Map函數(shù)處理后直接輸出的中間結(jié)果,應(yīng)該是下面哪種形式:

A.<"heIIo",1,1>><"hadoop",1>和<"?!窱d”,1>

B.<"hello",2>.<"hadoop",1>^<"worId",1>

C.<"heIIo",<1,1?><"hadoop",1>^<"worId",1>

D.<"hello",1>><"hello",1>.<"hadoop",1>和<"worId",1>

正確答案:D你選對(duì)了

3單選(2分)

對(duì)于文本行“hellohadoophelloworld",經(jīng)過(guò)WordCount的Reduce函數(shù)處理后的結(jié)果是:

A.<"helIo",<1,1?<"hadoop",1><"worId",1>

B.<"helIo",1><"helIo",1><"hadoop",1><"worId",1>

C.<"helIo",1,1><"hadoop",1><"worId",1>

D.<"heIIo",2><"hadoop",1X"worId",1>

正確答案:B你選對(duì)了

4多選(3分)

下列關(guān)于傳統(tǒng)并行計(jì)算框架(比如MPI)和MapReduce并行計(jì)算框架比較正確的是:

A.前者所需硬件價(jià)格貴,可擴(kuò)展性差,后者硬件便宜,擴(kuò)展性好

13

B.前者相比后者學(xué)習(xí)起來(lái)更難

C.前者是共享式(共享內(nèi)存/共享存儲(chǔ)),容錯(cuò)性差,后者是非共享式的,容錯(cuò)性好

D.前者適用于實(shí)時(shí)、細(xì)粒度計(jì)算、計(jì)算密集型,后者適用于批處理、非實(shí)時(shí)、數(shù)據(jù)密集型

正確答案:ABCD你選對(duì)了

5多選(3分)

MapReducel.0的體系結(jié)構(gòu)主要由哪幾個(gè)部分組成:

A.JobTracker

B.TaskTracker

C.Client

D.Task

正確答案:ABCD你選對(duì)了

第8章Hadoop再探討

1單選(2分)

下列說(shuō)法正確的是:

A.HDFSHA可用性不好

B.第二名稱節(jié)點(diǎn)是熱備份

C.HDFSHA提供高可用性,可以實(shí)現(xiàn)可擴(kuò)展性、系統(tǒng)性能和隔離性

D.第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題

正確答案:D你選對(duì)了

2單選(2分)

HDFSFederation設(shè)計(jì)不能解決“單名稱節(jié)點(diǎn)”存在的哪個(gè)問(wèn)題:

A.單點(diǎn)故障問(wèn)題

B.HDFS集群擴(kuò)展性

C.性能更高效

D.良好的隔離性

正確答案:A你選對(duì)了

3多選(3分)

下列哪些是HadoopL0存在的問(wèn)題:

A.抽象層次低

B.表達(dá)能力有限

C.開(kāi)發(fā)者自己管理作業(yè)之間的依賴關(guān)系

14

D.執(zhí)行迭代操作效率低

正確答案:ABCD你選對(duì)了

4多選(3分)

下列對(duì)Hadoop各組件的理解正確的是:

A.Oozie:工作流和協(xié)作服務(wù)引擎

B.Pig:處理大規(guī)模數(shù)據(jù)的腳本語(yǔ)言

C.Kafka:分布式發(fā)布訂閱消息系統(tǒng)

D.Tez:支持DAG作業(yè)的計(jì)算框架

正確答案:ABCD你選對(duì)了

5多選(3分)

對(duì)新一代資源管理調(diào)度框架YARN的理解正確的是:

A.YARN既是資源管理調(diào)度框架,也是一個(gè)計(jì)算框架

B.MapReduce2.0是運(yùn)行在YARN之上的計(jì)算框架,由YARN來(lái)為MapReduce提供資源管理調(diào)度服務(wù)

C.YARN可以實(shí)現(xiàn)“一個(gè)集群多個(gè)框架”,即在一個(gè)集群上部署一個(gè)統(tǒng)一的資源調(diào)度管理框架

D.YARN的體系結(jié)構(gòu)包含三個(gè)組件:ResourceManager,NodeManager,ApplicationMaster

正確答案:BCD你選對(duì)了

第9章數(shù)據(jù)倉(cāng)庫(kù)Hive

1單選(2分)

下列有關(guān)Hive和ImpaIa的對(duì)比錯(cuò)誤的是:

A.Hive與Impala中對(duì)SQL的解釋處理匕較相似,都是通過(guò)詞法分析生成執(zhí)行計(jì)劃

B.Hive與Impala使用相同的元數(shù)據(jù)

C.Hive適合于長(zhǎng)時(shí)間的批處理查詢分析,而Impala適合于實(shí)時(shí)交互式SQL查詢

D.Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí),會(huì)使用外存,而Impala也是如此

正確答案:D你選對(duì)了

2單選(2分)

下列關(guān)于Hive基本操作命令的解釋錯(cuò)誤的是:

A.createtableifnotexistsusr(idbigint,namestring,ageint);//如果usr表不存在,創(chuàng)建

表usr,含三個(gè)屬性id,name,age

B.loaddataIocaIinpathVusr/local/data*overwriteintotabIeusr;//才巴目

錄'/usr/1ocaI/data'下的數(shù)據(jù)文件中的數(shù)據(jù)以追加的方式裝載進(jìn)usr表

C.createdatabaseuserdb;//創(chuàng)建數(shù)據(jù)庫(kù)userdb

15

________________________________________________________

D.insertoverwritetablestudentselect*fromuserwhereage>10;//向表usr1中插入來(lái)自

usr表的age大于10的數(shù)據(jù)并覆蓋student表中原有數(shù)據(jù)

正確答案:B你選對(duì)了

3多選(3分)

下列說(shuō)法正確的是:

A.ImpaIa和Hive、HDFS^HBase等工具可以統(tǒng)一部署在一個(gè)Hadoop平臺(tái)上

B.數(shù)據(jù)倉(cāng)庫(kù)Hive不需要借助于HDFS就可以完成數(shù)據(jù)的存儲(chǔ)

C.Hive本身不存儲(chǔ)和處理數(shù)據(jù),依賴HDFS存儲(chǔ)數(shù)據(jù),依賴MapReduce處理數(shù)據(jù)

D.HiveQL語(yǔ)法與傳統(tǒng)的SQL語(yǔ)法很相似

正確答案:ACD你選對(duì)了

4多選(3分)

ImpaIa主要由哪幾個(gè)部分組成:

A.Hive

B.Impalad

C.StateStore

D.CLI

正確答案:BCD你選對(duì)了

5多選(3分)

以下屬于Hive的基本數(shù)據(jù)類型是:

A.BINARY

B.STRING

C.FLOAT

D.TINYINT

正確答案:ABCD你選對(duì)了

第10章Spark

1單選(2分)

SparkSQL目前暫時(shí)不支持下列哪種語(yǔ)言:

A.Python

B.Java

C.SeaIa

D.Lisp

16

正確答案:D你選對(duì)了

2單選(2分)

RDD操作分為轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類型,下列屬于動(dòng)作(Action)類型的

操作的是:

A.groupBy

B.fiIter

C.count

D.map

正確答案:C你選對(duì)了

3單選(2分)

下列說(shuō)法錯(cuò)誤的是:

A.在選擇SparkStreaming和Storm時(shí),對(duì)實(shí)時(shí)性要求高(比如要求毫秒級(jí)響應(yīng))的企業(yè)更傾向于選

擇流計(jì)算框架Storm

B.RDD采用情性調(diào)用,遇到“轉(zhuǎn)換(Transformation)”類型的操作時(shí),只會(huì)記錄RDD生成的軌跡,只

有遇到“動(dòng)作(Action)”類型的操作時(shí)才會(huì)觸發(fā)真正的計(jì)算

C.Spark支持三種類型的部署方式:StandaIone,SparkonMesos,SparkonYARN

D.RDD提供的轉(zhuǎn)換接口既適用fiIter等粗粒度的轉(zhuǎn)換,也適合某一數(shù)據(jù)項(xiàng)的細(xì)粒度轉(zhuǎn)換

正確答案:D你選對(duì)了

4單選(2分)

下列關(guān)于常見(jiàn)的動(dòng)作(Action)和轉(zhuǎn)換(Transformation)操作的API解釋錯(cuò)誤的是:

A.fiIter(func):篩選出滿足函數(shù)func的元素,并返回一個(gè)新的數(shù)據(jù)集

B.map(func):將每個(gè)元素傳遞到函數(shù)func中,并將結(jié)果返回為一個(gè)新的數(shù)據(jù)集

C.count{):返回?cái)?shù)據(jù)集中的元素個(gè)數(shù)

D.take(n):返回?cái)?shù)據(jù)集中的第n個(gè)元素

正確答案:D你選對(duì)了

5單選(2分)

下列大數(shù)據(jù)處理類型與其對(duì)應(yīng)的軟件框架不匹配的是:

A.復(fù)雜的批量數(shù)據(jù)處理:MapReduce

B.基于歷史數(shù)據(jù)的交互式查詢:Impala

C.基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:Storm

D.圖結(jié)構(gòu)數(shù)據(jù)的計(jì)算:Hive

正確答案:D你選對(duì)了

6多選(3分)

17

Apache軟件基金會(huì)最重要的三大分布式計(jì)算系統(tǒng)開(kāi)源項(xiàng)目包括:

A.Oracle

B.Hadoop

C.Storm

D.Spark

正確答案:ABC你選對(duì)了

7多選(3分)

Spark的主要特點(diǎn)包括:

A.運(yùn)行模式多樣

B.運(yùn)行速度快

C.通用性好

D.容易使用

。確答案:ABCD你選對(duì)了

8多選(3分)

下列關(guān)于Scala的說(shuō)法正確的是:

A.SeaIa運(yùn)行于Java平臺(tái),兼容現(xiàn)有的Java程序

B.Scala具備強(qiáng)大的并發(fā)性,支持函數(shù)式編程

C.Seala是一種多范式編程語(yǔ)言

D.Scala是Spark的主要編程語(yǔ)言,但Spark還支持Java、Python>R作為編程語(yǔ)言

正確答案:ABCD你選對(duì)了

9多選(3分)

Spark的運(yùn)行架構(gòu)包括:

A.運(yùn)行作業(yè)任務(wù)的工作節(jié)點(diǎn)WorkerNode

B.每個(gè)工作節(jié)點(diǎn)上負(fù)責(zé)具體任務(wù)的執(zhí)行進(jìn)程Executor

C.每個(gè)應(yīng)用的任務(wù)控制節(jié)點(diǎn)Driver

D.集群資源管理器ClusterManager

正確答案:ABCD你選對(duì)了

第11章流計(jì)算

1單選(2分)

流計(jì)算秉承一個(gè)基本理念,即數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而,如用戶點(diǎn)擊流:

A.降低

18

B.不確定

0.不變

D.升高

正確答案:A你選對(duì)了

2單選(2分)

Hadoop運(yùn)行的是MapReduce任務(wù),類似地,Storm運(yùn)行的任務(wù)叫做

A.Spout

B.Bolt

C.Tuple

D.Topology

正確答案:D你選對(duì)了

3多選(3分)

對(duì)于一個(gè)流計(jì)算系統(tǒng)來(lái)說(shuō),它應(yīng)達(dá)到如下哪些需求:

A.海量式

B.高性能

C.分布式

D.實(shí)時(shí)性

正確答案:A、B、C、D你選對(duì)了

4多選(3分)

數(shù)據(jù)采集系統(tǒng)的基本架構(gòu)包括哪些部分:

A.Controller

B.Store

C.Agent

D.ColIector

正確答案:B、C、D你選對(duì)了

5多選(3分)

以下哪些是開(kāi)源的流計(jì)算框架:

A.FacebookPuma

B.Yahoo!S4

C.IBMInfoSphereStreams

D.TwitterStorm

正確答案:B、D你選對(duì)了

6多選(3分)

19

下面哪幾個(gè)屬于Storm中的StreamGroupings的分組方式:

A.按照字段分組

B.廣播發(fā)送

C.隨機(jī)分組

D.全局分組

正確答案:A、B、C、D你選對(duì)了

第12章Flink

1單選(2分)

以下哪個(gè)不是Flink的優(yōu)勢(shì):

A.同時(shí)支持高吞吐、低延遲、高性能

B.不支持增量迭代

C.同時(shí)支持流處理和批處理

D.支持有狀態(tài)計(jì)算

正確答案:B你選對(duì)了

2單選(2分)

在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù):

A.SQL&Table庫(kù)

B.FlinkML

C.Gelly

D.CEP

正確答案:C你選對(duì)了

3多選(3分)

下面關(guān)于Flink的說(shuō)法正確的是:

A.FIink起源于Stratosphere項(xiàng)目,該項(xiàng)目是在2010年到2014年間由柏林工業(yè)大學(xué)、柏林洪堡大

學(xué)和哈索普拉特納研究所聯(lián)合開(kāi)展的

B.Flink可以同時(shí)支持實(shí)時(shí)計(jì)算和批量計(jì)算

C.FIink不是Apache軟件基金會(huì)的項(xiàng)目

D.FIink是Apache軟件基金會(huì)的5個(gè)最大的大數(shù)據(jù)項(xiàng)目之一

正確答案:A、B、D你選對(duì)了

4多選(3分)

Flink的主要特性包括:

20

A.精確一次的狀態(tài)一致性保障

B.批流一體化

C.精密的狀態(tài)管理

D.事件時(shí)間支持

正確答案:A、B、C、D你選對(duì)了

5多選(3分)

下面論述正確的是:

A.SparkStreaming通過(guò)采用微批處理方法實(shí)現(xiàn)了高吞吐和容錯(cuò)性,但是犧牲了低延遲和實(shí)時(shí)處理能

B.Storm雖然可以做到低延遲,但是無(wú)法實(shí)現(xiàn)高吞吐,也不能在故障發(fā)生時(shí)準(zhǔn)確地處理計(jì)算狀態(tài)

C.流處理架構(gòu)需要具備低延遲、高吞吐和高性能的特性,而目前從市場(chǎng)上已有的產(chǎn)品來(lái)看,只有Flink

可以滿足要求

D.Flink實(shí)現(xiàn)了GoogleDataflow流計(jì)算模型,是一種兼具高吞時(shí)、低延遲和高性能的實(shí)時(shí)流計(jì)算框

架,并且同時(shí)支持批處理和流處理

正確答案:A、B、C、D你選對(duì)了

6多選(3分)

Flink常見(jiàn)的應(yīng)用場(chǎng)景包括:

A.數(shù)據(jù)流水線應(yīng)用

B.事件驅(qū)動(dòng)型應(yīng)用

C.地圖應(yīng)用

D.數(shù)據(jù)分析應(yīng)用

正確答案:A、B、D你選對(duì)了

7多選(3分)

Flink核心組件棧分為哪三層:

A.物理部署層

B.Runtime核心層

C.Core層

D.API&Libraries層

正確答案:A、B、D你選對(duì)了

8多選(3分)

Flink有哪幾種部署模式:

A.運(yùn)行在GCE(谷歌云服務(wù))和EC2(亞馬遜云服務(wù))上

B.YARN集群模式

21

C.StandaIone集群模式

D.Local模式

正確答案:A、B、C、D你選對(duì)了

9多選(3分)

Flink系統(tǒng)主要由兩個(gè)組件組成,分別為:

A.JobManager

B.JobScheduIer

C.TaskScheduler

D.TaskManager

正確答案:A、D你選對(duì)了

10多選(3分)

在編程模型方面,F(xiàn)link提供了不同級(jí)別的抽象,以開(kāi)發(fā)流或批處理作業(yè),主要包括哪幾個(gè)級(jí)別的抽

象:

A.DataStreamAPI(有界或無(wú)界流數(shù)據(jù))以及DataSetAPI(有界數(shù)據(jù)集)

B.TableAPI

C.狀態(tài)化的數(shù)據(jù)流接口

D.SQL

正確答案:A、B、C、D你選對(duì)了

第13章圖計(jì)算

1單選(2分)

Pregel是一種基于模型實(shí)現(xiàn)的并行圖處理系統(tǒng):

A.TSP

B.STP

C.BSP

D.SBP

正確答案:C你選對(duì)了

2單選(2分)

谷歌在后Hadoop時(shí)代的新“三駕馬車”不包括:

A.Caffeine

B.DremeI

C.Pregel

D.Hama

正確答案:D你選對(duì)了

3多選(3分)

下列哪些是以圖頂點(diǎn)為中心的,基于消息傳遞批處理的并行圖計(jì)算框架:

22

A.Hama

B.Giraph

C.PregeI

D.Neo4j

正確答案:A、B、C你選對(duì)了

4多選(3分)

以下關(guān)于Pregel圖計(jì)算框架說(shuō)法正確的是:

A.通常只對(duì)滿足交換律和結(jié)合律的操作才會(huì)開(kāi)啟Combiner功能

B.Pregel采用檢查點(diǎn)機(jī)制來(lái)實(shí)現(xiàn)容錯(cuò)

C.對(duì)于全局拓?fù)涓淖儯琍regel采用了惰性協(xié)調(diào)機(jī)制

D.Aggregator提供了一種全局通信、監(jiān)控和數(shù)據(jù)查看的機(jī)制

正確答案:A、B、C、D你選對(duì)了

第14章大數(shù)據(jù)在不同領(lǐng)域的應(yīng)用

1單選(2分)

下列說(shuō)法錯(cuò)誤的是:

A.ItemCF算法推薦的是那些和目標(biāo)用戶之前喜歡的物品類似的其他物品

B.基于用戶的協(xié)同過(guò)濾算法(簡(jiǎn)稱UserCF算法)是目前業(yè)界應(yīng)用最多的算法

C.UserCF算法推薦的是那些和目標(biāo)用戶有共同興趣愛(ài)好的其他用戶所喜歡的物品

D.UserCF算法的推薦更偏向社會(huì)化,而ItemCF算法的推薦更偏向于個(gè)性化

正確答案:B你選對(duì)了

2多選(3分)

推薦方法包括哪些類型:

A.專家推薦

B.協(xié)同過(guò)濾推薦

C.基于內(nèi)容的推薦

D.基于統(tǒng)計(jì)的推薦

正確答案:A、B、C、D你選對(duì)了

期末試卷

1單選(2分)

數(shù)據(jù)產(chǎn)生方式的變革主要經(jīng)歷了三個(gè)階段,以下哪個(gè)不屬于這三個(gè)階段:

A.運(yùn)營(yíng)式系統(tǒng)階段

B.感知式系統(tǒng)階段

C.數(shù)據(jù)流階段

D.用戶原創(chuàng)內(nèi)容階段

正確答案:C你選對(duì)了

2單選(2分)

第三次信息化浪潮的發(fā)生標(biāo)志是以下哪種技術(shù)的普及:

A.互聯(lián)網(wǎng)

B.CPU

23

C.物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)

D.個(gè)人計(jì)算機(jī)

正確答案:C你選對(duì)了

3單選(2分)

在Flink中哪個(gè)是基于批處理的圖計(jì)算庫(kù):

A.SQL&Table庫(kù)

B.CEP

C.Geliy

D.FlinkML

正確答案:C你選對(duì)了

4單選(2分)

Hadoop的兩大核心是和

A.MapReduce;HBase

B.HDFS;HBase

C.HDFS;MapReduce

D.GFS;MapReduce

正確答案:C你選對(duì)了

5單選(2分)

HDFS默認(rèn)的一個(gè)塊大小是

A.64MB

B.8KB

C.32KB

D.16KB

正確答案:A你選對(duì)了

6單選(2分)

在分布式文件系統(tǒng)HDFS中,負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀?。?/p>

A.數(shù)據(jù)節(jié)點(diǎn)

B.第二名稱節(jié)點(diǎn)

C.名稱節(jié)點(diǎn)

D.主節(jié)點(diǎn)

正確答案:A你選對(duì)了

7單選(2分)

上傳當(dāng)前目錄下的本地文件file,txt到分布式文件系統(tǒng)HDFS的“/path”目錄下的Shell命令是:

A.hdfsdfs-put/pathfile.txt

B.hadoopdfs-put/pathfiIe.txt

C.hdfsfs-putfile.txt/path

D.hdfsdfs-putfile.txt/path

正確答案:D你選對(duì)了

8單選(2分)

在HDFS根目錄下創(chuàng)建一個(gè)文件夾/test,且/test文件夾內(nèi)還包含一個(gè)文件夾dir,正確的shell命令是:

A.hadoopfs-mkdir-p/test/dir

B.hdfsfs-mkdir-p/test/dir

C.hadoopdfs-mkdir/test/dir

24

D.hdfsdfs*mkdir-p/test/dir

正確答案:A你選對(duì)了

9單選(2分)

下列有關(guān)HBase的說(shuō)法正確的是:

A.在向數(shù)據(jù)庫(kù)中插入記錄時(shí),HBase和關(guān)系數(shù)據(jù)庫(kù)一樣,每次都是以“行”為單位把整條記錄插入數(shù)據(jù)庫(kù)

B.HBase是針對(duì)谷歌BigTable的開(kāi)源實(shí)現(xiàn),是高可靠、高性能的圖數(shù)據(jù)庫(kù)

C.HBase是一種NoSQL數(shù)據(jù)庫(kù)

D.HBase數(shù)據(jù)庫(kù)表可以設(shè)置該表任意列作為索引

正確答案:C你選對(duì)了

10單選(2分)

已知一張表student存儲(chǔ)在HBase中,向表中插入一條記錄{id:2015001,name:Mary,{score:math):88),其

id作為行鍵,其中,在插入數(shù)學(xué)成績(jī)88分時(shí),正確的命令是:

A.put'student','score:math','88'

B.put'student'20150011,'score:math','88'

C.put'student,2015001','math','88'

D.put'student',,2015001','88'

正確答案:B你選對(duì)了

11單選(2分)

NoSQL數(shù)據(jù)庫(kù)的三大理論基石不包括:

A.ACID

B.最終一致性

C.BASE

D.CAP

正確答案:A你選對(duì)了

12單選(2分)

在設(shè)計(jì)詞頻統(tǒng)計(jì)的MapReduce程序時(shí),對(duì)于文本行“helIobigdatahelIohadoop",經(jīng)過(guò)map函數(shù)處理后直

接輸出的結(jié)果應(yīng)該是(沒(méi)有發(fā)生combine和merge操作):

A.<"helIo",1,1>、<"bigdata",1>^<Mhadoop",1>

B.<"hello",<1,1?.<"W?<^匕",1>和<52(100d,1>

C.<"hello",2>、<"bigdata",1>^<"hadoop",1>

D.<"hello",1>.<"hello",1>、<"bigdata",I^Mfadoop”,1>

正確答案:D你選對(duì)了

13單選(2分)

假設(shè)已經(jīng)配置好PATH環(huán)境變量,啟動(dòng)Hadoop的命令是:

A.start-hdfs.sh

B.start-fs.sh

C.start-dfs.sh

D.start-hadoop.sh

正確答案:C你選對(duì)了

14單選(2分)

下列說(shuō)法錯(cuò)誤的是:

A.HDFSFederation使得HDFS的命名服務(wù)能夠水平擴(kuò)展

B.第二名稱節(jié)點(diǎn)是熱備份,而HDFSHA不是熱備份

25

C.HDFSHA可以解決單點(diǎn)故障問(wèn)題

D.第二名稱節(jié)點(diǎn)無(wú)法解決單點(diǎn)故障問(wèn)題

正確答案:B你選對(duì)了

15單選(2分)

RDD操作包括轉(zhuǎn)換(Transformation)和動(dòng)作(Action)兩種類型,下列RDD操作屬于動(dòng)作(Action)類型的是:

A.join

B.map

C.collect

D.groupBy

正確答案:C你選對(duì)了

16單選(2分)

下列關(guān)于Hive的說(shuō)法正確的是:

A.Hive支持頻繁數(shù)據(jù)更新

B.Hive不支持索引

C.Hive支持批量導(dǎo)入

D.Hive的可擴(kuò)展性差

正確答案:C你選對(duì)了

17多選(3分)

大數(shù)據(jù)的特點(diǎn)包括:

A.數(shù)據(jù)量大

B.處理速度快

C.價(jià)值密度低

D.數(shù)據(jù)種類繁多

正確答案:A、B、C、D你選對(duì)了

18多選(3分)

下列適用于批處理計(jì)算的框架有哪些:

A.PregeI

B.Spark

C.MapReduce

D.Storm

正確答案:B、C你選對(duì)了

19多選(3分)

下列適用于流計(jì)算的框架有哪些:

A.Storm

B.DremeI

C.SparkStreaming

D.PregeI

正確答案:A、C你選對(duì)了

20多選(3分)

Flink核心組件棧分為哪三層:

A.Core層

B.Runtime核心層

C.API&Libraries層

26

D.物理部署層

正確答案:B、C、D你選對(duì)了

21多選(3分)

從技術(shù)架構(gòu)上來(lái)看,物聯(lián)網(wǎng)可以分為哪幾層:

A.感知層

B.處理層

C.應(yīng)用層

D.網(wǎng)絡(luò)層

正確答案:A、B、C、D你選對(duì)了

22多選(3分)

HBase需要根據(jù)哪些屬性來(lái)唯一地確定一個(gè)單元格(celI)中的某個(gè)版本數(shù)據(jù):

A.行鍵

B.列族

C.列限定符

D.時(shí)間戳

正確答案:A、B、C、D你選對(duì)了

23多選(3分)

典型的NoSQL數(shù)據(jù)庫(kù)的類型包括:

A.鍵值數(shù)據(jù)庫(kù)

B.列族數(shù)據(jù)庫(kù)

C.圖數(shù)據(jù)庫(kù)

D.文檔數(shù)據(jù)庫(kù)

正確答案:A、B、C、D你選對(duì)了

24多選(3分)

CAP是指:

A.持久性

B.可用性

C.一致性

D.分區(qū)容雙性

正確答案:B、C、D你選對(duì)了

25多選(3分)

云計(jì)算主要包括哪

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論