欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

linux環(huán)境不使用hadoop安裝單機版spark的方法

 更新時間:2019年04月03日 11:02:48   作者:stpeace  
今天小編就為大家分享一篇關于linux環(huán)境不使用hadoop安裝單機版spark的方法,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧

大數(shù)據(jù)持續(xù)升溫, 不熟悉幾個大數(shù)據(jù)組件, 連裝逼的口頭禪都沒有。 最起碼, 你要會說個hadoop, hdfs, mapreduce, yarn, kafka, spark, zookeeper, neo4j吧, 這些都是裝逼的必備技能。

關于spark的詳細介紹, 網(wǎng)上一大堆, 搜搜便是, 下面, 我們來說單機版的spark的安裝和簡要使用。

0.  安裝jdk,  由于我的機器上之前已經(jīng)有了jdk, 所以這一步我可以省掉。 jdk已經(jīng)是很俗氣的老生常談了, 不多說, 用java/scala的時候可少不了。

ubuntu@VM-0-15-ubuntu:~$ java -version
openjdk version "1.8.0_151"
OpenJDK Runtime Environment (build 1.8.0_151-8u151-b12-0ubuntu0.16.04.2-b12)
OpenJDK 64-Bit Server VM (build 25.151-b12, mixed mode)
ubuntu@VM-0-15-ubuntu:~$ 

1.  你并不一定需要安裝hadoop, 只需要選擇特定的spark版本即可。你并不需要下載scala, 因為spark會默認帶上scala shell. 去spark官網(wǎng)下載, 在沒有hadoop的環(huán)境下, 可以選擇:spark-2.2.1-bin-hadoop2.7, 然后解壓, 如下:

ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc$ ll
total 196436
drwxrwxr-x 3 ubuntu ubuntu   4096 Feb 2 19:57 ./
drwxrwxr-x 9 ubuntu ubuntu   4096 Feb 2 19:54 ../
drwxrwxr-x 13 ubuntu ubuntu   4096 Feb 2 19:58 spark-2.2.1-bin-hadoop2.7/
-rw-r--r-- 1 ubuntu ubuntu 200934340 Feb 2 19:53 spark-2.2.1-bin-hadoop2.7.tgz

2.  spark中有python和scala版本的, 下面, 我來用scala版本的shell, 如下:

ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ bin/spark-shell 
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
18/02/02 20:12:16 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
18/02/02 20:12:16 WARN Utils: Your hostname, localhost resolves to a loopback address: 127.0.0.1; using 172.17.0.15 instead (on interface eth0)
18/02/02 20:12:16 WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address
Spark context Web UI available at http://172.17.0.15:4040
Spark context available as 'sc' (master = local[*], app id = local-1517573538209).
Spark session available as 'spark'.
Welcome to
   ____       __
   / __/__ ___ _____/ /__
  _\ \/ _ \/ _ `/ __/ '_/
  /___/ .__/\_,_/_/ /_/\_\  version 2.2.1
   /_/
Using Scala version 2.11.8 (OpenJDK 64-Bit Server VM, Java 1.8.0_151)
Type in expressions to have them evaluated.
Type :help for more information.
scala> 

來進行簡單操作:

scala> val lines = sc.textFile("README.md")
lines: org.apache.spark.rdd.RDD[String] = README.md MapPartitionsRDD[1] at textFile at <console>:24
scala> lines.count()
res0: Long = 103
scala> lines.first()
res1: String = # Apache Spark
scala> :quit
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ 
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ 
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$  
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ wc -l README.md 
103 README.md
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ head -n 1 README.md 
# Apache Spark
ubuntu@VM-0-15-ubuntu:~/taoge/spark_calc/spark-2.2.1-bin-hadoop2.7$ 

來看看可視化的web頁面, 在Windows上輸入:  http://ip:4040

OK,  本文僅僅是簡單的安裝, 后面我們會繼續(xù)深入介紹spark.

總結

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內(nèi)容請查看下面相關鏈接

相關文章

  • ubuntu16.04下vim安裝失敗的原因分析及解決方案

    ubuntu16.04下vim安裝失敗的原因分析及解決方案

    重裝了ubuntu系統(tǒng),安裝vim出現(xiàn)了很多奇葩問題,今天百度查閱資料才順利解決。今天小編特此把解決思路分享到腳本之家平臺,需要的朋友參考下吧
    2016-11-11
  • Ubuntu18.04通過源碼安裝Odoo14的教程

    Ubuntu18.04通過源碼安裝Odoo14的教程

    本系列文章針對Odoo 14版,從系統(tǒng)安裝,開發(fā)環(huán)境配置,代碼結構,主要功能升級,源碼賞析,Anodoo對Odoo的關鍵擴展等角度,預先給大家介紹即將在2020年發(fā)布的這一最新版本
    2020-02-02
  • Centos7修改主機名hostname的三種方法

    Centos7修改主機名hostname的三種方法

    今天小編就為大家分享一篇關于Centos7修改主機名hostname的三種方法,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-01-01
  • Linux網(wǎng)絡啟動問題:Device does not seem to be present解決辦法

    Linux網(wǎng)絡啟動問題:Device does not seem to be present解決辦法

    這篇文章主要介紹了Linux網(wǎng)絡啟動問題:Device does not seem to be present解決辦法的相關資料,希望通過本文能幫助到大家解決這樣的問題,需要的朋友可以參考下
    2017-10-10
  • linux下查看端口是否被占用以及查看所有端口【推薦】

    linux下查看端口是否被占用以及查看所有端口【推薦】

    這篇文章主要介紹了linux下查看端口是否被占用以及查看所有端口的相關資料,需要的朋友可以參考下
    2018-06-06
  • CentOS 7中Nginx日志定時拆分實現(xiàn)過程詳解

    CentOS 7中Nginx日志定時拆分實現(xiàn)過程詳解

    這篇文章主要介紹了CentOS 7中Nginx日志定時拆分實現(xiàn)過程詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-06-06
  • 關于Grep的多次管道過濾的問題及解決

    關于Grep的多次管道過濾的問題及解決

    這篇文章主要介紹了關于Grep的多次管道過濾的問題及解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-03-03
  • linux下安裝Hadoop的詳細教程

    linux下安裝Hadoop的詳細教程

    這篇文章主要介紹了linux下安裝Hadoop的詳細教程,Hadoop是一個分布式系統(tǒng)基礎架構,充分利用集群的威力進行高速運算和存儲,需要的朋友可以參考下
    2023-03-03
  • Linux如何運行SQL文件

    Linux如何運行SQL文件

    這篇文章主要介紹了Linux如何運行SQL文件問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-12-12
  • Gzip在apache2中的設置和squid對它的處理

    Gzip在apache2中的設置和squid對它的處理

    gzip可以級大的加速網(wǎng)站.有時壓縮比率高到80%,近來測試了一下,最少都有40%以上,還是相當不錯的.在Apache2之后的版本,模塊名不叫gzip,而叫mod_deflate
    2011-12-12

最新評論