




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于hadoop的大規(guī)模文本處理技術(shù)實驗軟件1102張國宇Set up Hado op on Ubuntu 64-bit提示:前面的putty軟件安裝省略;直接進入 JDK的安裝。1.1 nstall Sun JDKv安裝 JDK>PPA。打由于Sun JDK在ubuntu的軟件中心中無法找到,我們必須使用外部的 開終端并且運行以下命令:sudo add-a pt-re pository pp a:ferramroberto/java sudo ap t-get up date sudo ap t-get in stall sun-java6-b in sudo ap t-get in
2、stall sun-java6-jdkAdd JAVA HOME variablev 配置環(huán)境變量 >:先輸入粘貼下面文字:sudo vi /etc/e nvir onment再將下面的文字輸入進去:按i鍵添加,esc鍵退出,X保存退出;如下圖:export JAVA_HOME二"/usr/lib/jvm/160"Test the success of installation in Terminal在終端測試安裝是否成功 >: sudo . /etc/e nviro nment java -zersion2. Check SSH Settingv檢查 ssh
3、的設(shè)置 >ssh localhost如果出現(xiàn)“ conn ection refused你最好重新安裝ssh (如下命令可以 安裝):sudo apt-get install openssh-server openssh-client如果你沒有通行證ssh到主機,執(zhí)行下面的命令:ssh-keygen -t dsa -P '' -f /.ssh/id_dsa cat /.ssh/ >> /.ssh/authorized_keys3. Setup Hadoop<安裝 hadoop>安裝 apache2 sudo apt-get install apach
4、e2下載 hadoop:1.0.4解壓hadoop所下載的文件包:tar xvfz 1.0.4”作為hadoop的根目錄:下載最近的一個穩(wěn)定版本,解壓。編輯 / 定義 java_homeuse/library/java-6-sun-1.6.0.26Sudo vi conf/將以下內(nèi)容加到文件最后:# The java implementation to use. Required.export JAVA_HOME=/usr/lib/jvm/1.6.0Pseudo-Distributed Op eratio n (Sin gle-Node Cluster) < 偽分布式操作(單 節(jié)點集群)
5、 >:將下面中間部分插入:(得到如圖:)cat conf/: <configuration><property> </property></configuration> cat conf/: <configuration><property><name></name> <value>1</value></property></configuration> cat conf/: <configuration><property&g
6、t;<value>localhost:9001</value></property></configuration>Switch to hadoop root directory and format a new distributed file system<轉(zhuǎn)向根目錄,格式化一個新的文件分布式系統(tǒng) >: bin/hadoop namenode -ormat注意:這一步一定不能掉,否則后面會出錯!You' ll get info likebeen successfully formatted.Storayg/temdpir/
7、ehcatdoop-ubuntu/dfs/name has” Remember this path is the HDFS homedirectory of name node.(你會得到提示:你已經(jīng)成功格式化。)Start and stop hadoop daemon(s 啟動和終止進程。)bin/ (start the hadoop)bin/ (stop the hadoop)Web interfaces for the NameNode and the JobTracker:NameNode 提示:如果前面沒有格式化成功, 這個網(wǎng)址會出現(xiàn)就不去的現(xiàn)象!如果進不去就先結(jié)束進程,重新格式化然
8、后再開始進程。JobTracker 4. Deploy An Example Map-Reduce Job<置 Ma-reduce Job的一個例子創(chuàng)建路徑 " /home/ubuntu/mapreduce/wordcount/ " ,并在該目錄下放置文本文件。然后將這些文件復(fù)制到 HDFS目錄:bin/hadoop dfs -copyFromLocal/home/ubuntu/mapreduce/wordcount/tmp/hadoop-ubuntu/dfs/name/wordcountbin/hadoop dfs -ls /tmp/hadoop-ubuntu/df
9、s/name/wordcountRun the job:bin/hadoop jar hadoop*examples*.jar wordcount/tmp/hadoop-ubuntu/dfs/name/wordcount/tmp/hadoop-ubuntu/dfs/name/wordcount-outputIf the output info looks no problem, copy the output file from HDFS tolocal directoryv如果輸出信息看起來沒有問題,從HDFS輸出復(fù)制文件到本地目錄的: >:bin/hadoop dfs -getmerge/tmp/hadoop-ubuntu/dfs/name/wordcount-output/home/ubuntu/mapreduce/wordcount/Now you can open the output file in your local directory to view theresults在你可以打開輸出文件在您的本地目錄查看結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- RBT214內(nèi)審員考試試題及答案
- 2025成都市房屋裝修合同樣本
- 離婚協(xié)議書模板:財產(chǎn)分配及子女監(jiān)護權(quán)協(xié)議范本
- photoshop面試試題及答案
- padi aow理論考試試題及答案
- 風(fēng)光制氫一體化項目投資估算
- 復(fù)雜系統(tǒng)測試的分階段策略試題及答案
- 餐飲企業(yè)加盟店出租及品牌授權(quán)合作協(xié)議
- 軟件測試的未來發(fā)展試題及答案
- 數(shù)據(jù)庫快速查詢技術(shù)試題及答案
- 玉盤二部合唱簡譜
- 燈謎文化智慧樹知到期末考試答案章節(jié)答案2024年西安交通大學(xué)
- 【醫(yī)院管理】課題研究型醫(yī)院品管圈概念與實操課件
- 英語初級聽力(Listen-to-This-1)教師用書1
- 商混站(商品混凝土公司)安全生產(chǎn)操作規(guī)程
- 國父孫中山課件
- 2022版輸變電工程標(biāo)準(zhǔn)工藝(土建分冊)培訓(xùn)課件- 第5章
- 安全主題班會 《防洪防汛知識講解》教學(xué)課件
- GB∕T 1727-2021 漆膜一般制備法
- 初中生休學(xué)申請書
- 業(yè)主委員會成立全套表格(20210128041538)
評論
0/150
提交評論