當前位置:首頁 » 網頁前端 » sparkwebui
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

sparkwebui

發布時間: 2023-07-16 18:07:22

A. spark 4040頁面 不能訪問。 如果使用的是spark-shell啟動寫程序,4040可以出

4040頁面只有在有spark 任務運行時才能訪問,你在任務訪問日誌里也能找到類似的語句,提交job後Spark-UI才會啟動。

當任務運行完了,立馬埠就釋放了。


所以建議你配置一下spark-history 頁面,運行完了可以查看已經finished的job,下面是簡單的配置步驟,具體的還請網路教程。


spark-default.conf中配置如下參數

spark.eventLog.enabled true
spark.eventLog.dir hdfs://hadoopmaster:8020/user/spark_event_log
spark.history.fs.logDirectory hdfs://hadoopmaster:8020/user/spark_event_log

web ui http://sparkmaster:18080/

spark-env.sh

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=7777 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs://had
oop000:8020/directory"

參數描述:

spark.history.ui.port=7777調整WEBUI訪問的埠號為7777

spark.history.fs.logDirectory=hdfs://hadoop000:8020/directory配置了該屬性後,在start-history-server.sh時就無需再顯示的指定路徑

spark.history.retainedApplications=3 指定保存Application歷史記錄的個數,如果超過這個值,舊的應用程序信息將被刪除

啟動

cd $SPARK_HOME/sbin
start-history-server.sh

需要在啟動時指定目錄:

start-history-server.shhdfs://hadoop000:8020/directory

注意的是spark 程序中需要將sparkcontext stop 掉,否則即便是運行完畢,web頁面也只能顯示incompleted applications,而不是completed applications

B. spark master web ui 能看到些什麼信息

1.查看正在運行app的信息
訪問master WEB UI : http://master:8080
然後點擊Running Applications 下Application ID或者Name查看信息

2.查看運行完成app的信息
按照上面在master WEB UI中的操作方法訪問
會產生報錯內容:

點擊(此處)折疊或打開
No event logs were found for this application! To enable event logging, set spark.eventLog.enabled to true and spark.eventLog.dir to the directory to which your event logs are written.
解決辦法:按照報錯內容
(1)在$SPARK_HOME/conf中的創建spark-defaults.conf

點擊(此處)折疊或打開
cp spark-defaults.conf.template spark-defaults.conf
然後在spark-defaults.conf中添加如下數據

點擊(此處)折疊或打開
spark.eventLog.enabled=true

spark.eventLog.dir=/tmp/
(2)切換到/tmp/目錄下,看有沒有spark-events文件夾

點擊(此處)折疊或打開
sudo mkdir spark-events

sudo chmod 777 spark-events
經過以上操作之後就可以像查看正在運行app一樣在web ui查看已完成app的執行過程的詳細信息

3.總結
(1)創建好事件的log信息,並設置好路徑,就可以通過spark的web driver來訪問已完成app的詳細信息
(2)注意在寫的spark python 程序結束時,執行sc.stop() 來完成app
(3)此方法使用在standalone mode下,若在其他模式下,可通過執行腳本$SPARK_HOME/sbin/start-history-server.sh 實現

4.參考鏈接:
http://apache-spark-user-list.1001560.n3.nabble.com/Spark-webUI-application-details-page-td3490.html
http://apache-spark-user-list.1001560.n3.nabble.com/Viewing-web-UI-after-fact-td12023.html

C. 大數據系統WebUI默認埠號速查

1、HDFS頁面:50070

2、YARN的管理界面:8088

3、HistoryServer的管理界面:19888

4、Zookeeper的服務埠號:2181

5、Mysql的服務埠號:3306

6、Hive.server1=10000

7、Kafka的服務埠號:9092

8、azkaban界面:8443

9、Hbase界面:16010,60010

10、Spark的界面:8080

11、Spark的URL:7077