




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
BigDataAnalyticsToolsandTheirKeyFeatures
Unit
5TextBContents
NewWords
Abbreviations
Phrases參考譯文NewWordsNewWordsNewWordsPhrasesAbbreviationsListeningtoTextA大數(shù)據(jù)分析工具及其主要功能隨著大數(shù)據(jù)量的增加和云計(jì)算的巨大增長(zhǎng),尖端的大數(shù)據(jù)分析工具已成為實(shí)現(xiàn)有意義的數(shù)據(jù)分析的關(guān)鍵。在本文中,我們將討論頂級(jí)的大數(shù)據(jù)分析工具及其主要功能。1.ApacheStormApacheStorm是一個(gè)開源的免費(fèi)大數(shù)據(jù)計(jì)算系統(tǒng)。它也是具有實(shí)時(shí)框架的Apache產(chǎn)品,用于支持任何編程語言的數(shù)據(jù)流處理。它提供一個(gè)具有實(shí)時(shí)計(jì)算功能的分布式實(shí)時(shí)、容錯(cuò)處理系統(tǒng)。Storm調(diào)度程序通過參考拓?fù)渑渲脕砉芾砭哂卸鄠€(gè)節(jié)點(diǎn)的工作負(fù)載,并且可以與Hadoop分布式文件系統(tǒng)(HDFS)很好地配合使用。功能:?以每個(gè)節(jié)點(diǎn)每秒處理一百萬條100字節(jié)消息為基準(zhǔn)。?Storm確保數(shù)據(jù)單元至少被處理一次。?具有出色的水平可擴(kuò)展性。?具有內(nèi)置的容錯(cuò)功能。?崩潰時(shí)自動(dòng)重新啟動(dòng)。?它是用clojure語言編寫的。?它與有向無環(huán)圖(DAG)拓?fù)湟黄鹗褂谩?輸出文件為JSON格式。?它具有多個(gè)用例——實(shí)時(shí)分析、日志處理、ETL、連續(xù)計(jì)算、分布式RPC、機(jī)器學(xué)習(xí)。參考譯文2.TalendTalend是一個(gè)大數(shù)據(jù)工具,可簡(jiǎn)化和自動(dòng)化執(zhí)行大數(shù)據(jù)集成。它的圖形向?qū)Э缮杀緳C(jī)代碼。它還允許進(jìn)行大數(shù)據(jù)集成、主數(shù)據(jù)管理并檢查數(shù)據(jù)質(zhì)量。功能:?簡(jiǎn)化大數(shù)據(jù)的ETL和ELT。?實(shí)現(xiàn)Spark的速度和規(guī)模。?加快你的實(shí)時(shí)性。?處理多個(gè)數(shù)據(jù)源。?提供大量連接器,這又使你可以根據(jù)需要自定義解決方案。?Talend大數(shù)據(jù)平臺(tái)通過生成本機(jī)代碼簡(jiǎn)化了MapReduce和Spark的使用。?通過機(jī)器學(xué)習(xí)和自然語言處理提高數(shù)據(jù)質(zhì)量。?其敏捷DevOps可加速大數(shù)據(jù)項(xiàng)目。?簡(jiǎn)化所有DevOps流程。參考譯文參考譯文3.ApacheCouchDBApacheCouchDB是一個(gè)開放源代碼、跨平臺(tái)、面向文檔的NoSQL數(shù)據(jù)庫,旨在易于使用并擁有可擴(kuò)展的體系結(jié)構(gòu)。它是用面向并發(fā)的語言Erlang編寫的。CouchDB將數(shù)據(jù)存儲(chǔ)在JSON文檔中,可以通過網(wǎng)絡(luò)進(jìn)行訪問或使用JavaScript查詢。它提供帶有容錯(cuò)存儲(chǔ)的分布式擴(kuò)展性能。功能:?CouchDB是一個(gè)單節(jié)點(diǎn)數(shù)據(jù)庫,其工作方式與任何其他數(shù)據(jù)庫一樣。?它允許在任意數(shù)量的服務(wù)器上運(yùn)行單個(gè)邏輯數(shù)據(jù)庫服務(wù)器。?它使用了無處不在的HTTP協(xié)議和JSON數(shù)據(jù)格式。?文檔插入、更新、檢索和刪除非常容易。?可以在不同語言之間轉(zhuǎn)移JSON格式。4.ApacheSparkApacheSpark也是一個(gè)非常流行的開源大數(shù)據(jù)分析工具。Spark擁有80多個(gè)運(yùn)行器,可輕松構(gòu)建并行應(yīng)用程序。它被廣泛用于組織中以處理大型數(shù)據(jù)集。功能:?它有助于在Hadoop集群中運(yùn)行應(yīng)用程序,把內(nèi)存速度提高多達(dá)100倍、磁盤速度提高10倍。?提供快速處理。?它支持復(fù)雜的分析。?它可以與Hadoop和現(xiàn)有Hadoop數(shù)據(jù)集成。?它提供Java、Scala或Python的內(nèi)置API。?Spark提供了內(nèi)存中數(shù)據(jù)處理功能,該速度比MapReduce利用的磁盤處理要快得多。?此外,Spark可在云和本地與HDFS、OpenStack和ApacheCassandra配合使用,為企業(yè)的大數(shù)據(jù)操作增加了另一層多功能性。
參考譯文5.SpliceMachineSpliceMachine是一個(gè)大數(shù)據(jù)分析工具。其架構(gòu)可跨AWS、Azure和Google等公共云進(jìn)行移植。功能:?它可以動(dòng)態(tài)地從幾個(gè)節(jié)點(diǎn)擴(kuò)展到數(shù)千個(gè)節(jié)點(diǎn),以支持各種規(guī)模的應(yīng)用程序。?SpliceMachine優(yōu)化器自動(dòng)評(píng)估分布式HBase區(qū)域的每個(gè)查詢。?減少管理、更快地部署并降低風(fēng)險(xiǎn)。?它能應(yīng)對(duì)快速的流數(shù)據(jù)、開發(fā)、測(cè)試和部署機(jī)器學(xué)習(xí)模型。6.PlotlyPlotly是一種分析工具,可讓用戶創(chuàng)建圖表和儀表板以進(jìn)行在線共享。功能:?它可以輕松地將任何數(shù)據(jù)變成醒目的且信息豐富的圖形。?它為被審核行業(yè)提供有關(guān)數(shù)據(jù)來源的詳細(xì)信息。?它通過免費(fèi)的社區(qū)計(jì)劃提供不受限制的公共文件托管。參考譯文7.AzureHDInsightAzureHDInsight是云中的Spark和Hadoop服務(wù)。它提供標(biāo)準(zhǔn)和高級(jí)兩類大數(shù)據(jù)云產(chǎn)品。它為組織提供了企業(yè)規(guī)模的集群來運(yùn)行其大數(shù)據(jù)工作負(fù)載。功能:?它通過行業(yè)領(lǐng)先的SLA提供可靠的分析。?提供企業(yè)級(jí)安全性和監(jiān)管。?它保護(hù)數(shù)據(jù)資產(chǎn),并將本地安全性和治理控制擴(kuò)展到云。?對(duì)于開發(fā)人員和科學(xué)家來說,這是一個(gè)高生產(chǎn)率的平臺(tái)。?它與領(lǐng)先的生產(chǎn)力應(yīng)用程序集成在一起。?無需購買新硬件或支付其他前期費(fèi)用即可在云中部署Hadoop。參考譯文參考譯文8.SkytreeSkytree是一個(gè)大數(shù)據(jù)分析工具,可讓數(shù)據(jù)科學(xué)家更快地構(gòu)建更準(zhǔn)確的模型。它提供了易于使用的準(zhǔn)確的預(yù)測(cè)性機(jī)器學(xué)習(xí)模型。功能:?它具有高度可擴(kuò)展的算法。?它是數(shù)據(jù)科學(xué)家的人工智能。?它使數(shù)據(jù)科學(xué)家能夠可視化地呈現(xiàn)并了解機(jī)器學(xué)習(xí)決策背后的邏輯。?通過Skytree輕松使用GUI或用Java自動(dòng)編程。?具有模型可解釋性。?它旨在通過數(shù)據(jù)準(zhǔn)備功能解決魯棒預(yù)測(cè)問題。?它是程序化的并允許GUI訪問。9.LumifyLumify被認(rèn)為是可視化平臺(tái)、大數(shù)據(jù)融合和分析工具。它通過一系列分析選項(xiàng)幫助用戶發(fā)現(xiàn)連接并探索其數(shù)據(jù)中的關(guān)系。功能:?它提供具有各種自動(dòng)布局的2D和3D圖形可視化。?它提供了圖實(shí)體之間的鏈接分析、與地圖系統(tǒng)的集成、地理空間分析、多媒體分析以及對(duì)一組項(xiàng)目或工作空間的實(shí)時(shí)協(xié)作。?它具有針對(duì)文本內(nèi)容、圖像和視頻的特定處理和界面元素。?其空間功能使你可以將工作組織到一組項(xiàng)目或工作區(qū)中。?它基于成熟的、可擴(kuò)展的大數(shù)據(jù)技術(shù)。?它支持基于云的環(huán)境。它可以與Amazon的AWS完美配合。
參考譯文10.HadoopHadoop在大數(shù)據(jù)處理領(lǐng)域的久居榜首。它以其大規(guī)模數(shù)據(jù)處理能力而聞名。由于開源的大數(shù)據(jù)框架可以在本地或云中運(yùn)行,因此對(duì)硬件的要求較低。功能:?使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療物資采購風(fēng)險(xiǎn)管理與控制
- 代買貨物合同范例
- 買賣門市定金合同范例
- 2025年小學(xué)班主任工作總結(jié)經(jīng)驗(yàn)教訓(xùn)總結(jié)模版
- 買賣大型設(shè)備合同范例
- 公司配件采購合同范例
- 廣電工作者個(gè)人年度工作總結(jié)模版
- 人口健康信息分析與教育引導(dǎo)
- erp系統(tǒng)維護(hù)合同范例
- 專職教室聘用合同范例
- 初二地理考試試題及答案
- 2024-2025湘科版小學(xué)科學(xué)四年級(jí)下冊(cè)期末考試卷及答案(三套)
- 運(yùn)動(dòng)員心理調(diào)適靜療小組工作計(jì)劃
- 2025湖南建投集團(tuán)春季校園招聘239人筆試參考題庫附帶答案詳解
- 反邪教測(cè)試題及答案
- 貸款合同授信協(xié)議
- 工程抗震考試試題及答案
- 2024年陜西延長(zhǎng)石油有限責(zé)任公司管理人才招聘真題
- 思政微課紅色教育
- 保安公司組織架構(gòu)、崗位制度及保安管理制度
- 2025年安徽省馬鞍山花山公安分局輔警崗位招聘48人歷年自考難、易點(diǎn)模擬試卷(共500題附帶答案詳解)
評(píng)論
0/150
提交評(píng)論