webhdfs詳解
簡(jiǎn)介 hdfs提供了一種除了通過(guò)rpc的方式進(jìn)行文件操作的方式之外,還提供了http的方式對文件進(jìn)行操作的方式:webhdfs。支持HDFS 的完整FileSystem / FileContext接口。 其中Router和NameNode都支持了webhdfs的功能,具體實(shí)現有差別。 使用 文件系統URI與HTTP URL WebHDFS的文件系統方案為“ webhdfs:// ”。WebHDFS文件系統URI具有以下格式。 webhdfs://<主機 ......
hadoop
hdfs
|
2025-05-16
0 評論
793 瀏覽
【Hadoop仿真】如何在仿真NodeManager中實(shí)現心跳
Hadoop自帶的hadoop-sls只能用于壓測調度器,可在實(shí)際中影響ResourceManager性能的因素比較多,不能只看調度器。當前項目可構造海量的Fake NM節點(diǎn),用于模擬線(xiàn)上RM的巨大壓力場(chǎng)景,進(jìn)行優(yōu)化。首先需要對NM進(jìn)行仿真。
原創(chuàng )
hadoop
Yarn
ResourceManager
|
2025-04-13
0 評論
501 瀏覽
Hadoop Yarn的ResourceManager壓測指南
Hadoop自帶的hadoop-sls只能用于壓測調度器,可在實(shí)際中影響ResourceManager性能的因素比較多,不能只看調度器。 當前項目可構造海量的Fake NM節點(diǎn),用于模擬線(xiàn)上RM的巨大壓力場(chǎng)景,進(jìn)行優(yōu)化。 詳細參見(jiàn):https://github.com/zeekling/yarnRmTester
hadoop
Yarn
ResourceManager
原創(chuàng )
|
2025-04-13
0 評論
10 瀏覽
Mapredcue作業(yè)啟動(dòng)
Mapreduce作業(yè)啟動(dòng)源碼解析,從源碼開(kāi)始理解Mapreduce。
hadoop
mapreduce
|
2025-03-29
0 評論
473 瀏覽
linux idea 啟動(dòng)慢、運行慢
解決Idea啟動(dòng)慢,運行慢的問(wèn)題。
linux
idea
|
2023-07-15
1 評論
7,047 瀏覽
Gitea 自建代碼倉流量大坑
背景 前端時(shí)間租的騰訊云服務(wù)器是按照流量計費的,最近一段時(shí)間流量走的老快了,并且發(fā)現默認1G的帶寬老是卡。 原因 通過(guò)分析nginx的日志發(fā)現有大量的爬蟲(chóng)在大批量的訪(fǎng)問(wèn)代碼倉。導致占用了大量帶寬。 解決 nginx中過(guò)濾爬蟲(chóng) 在nginx中配置下面信息,過(guò)濾掉大量爬蟲(chóng)的請求。 if ($http_user_agent ~ "(meta-externalagent|Amazonbot|ClaudeBot|Baiduspider|SemrushBot|bing ......
gitea
|
2025-03-09
0 評論
910 瀏覽
container-executor 詳解
簡(jiǎn)介 container-executor 是NodeManager管理Container很重要的一個(gè)工具,是深入學(xué)習Yarn作業(yè)調度不可缺少的一個(gè)知識點(diǎn),值得深入學(xué)習。本文只描述比較基礎的功能點(diǎn)(目前不會(huì )包含Docker相關(guān))。 核心功能點(diǎn) checksetup 主要是檢查container-executor的配置是否ok,沒(méi)有其他功能。核心代碼如下: case CHECK_SETUP: //we already did this exit_code ......
hadoop
|
2025-03-02
0 評論
320 瀏覽
Idea Hadoop 源碼YarnServiceProtos無(wú)法補全問(wèn)題
問(wèn)題現象 使用IDEA打開(kāi)Hadoop源碼之后,發(fā)現YarnServiceProtos部分代碼無(wú)法補全,已經(jīng)安裝了protobuf相關(guān)的插件。 原因以及解決方法 再打開(kāi)YarnServiceProtos文件的時(shí)候會(huì )提示類(lèi)似文件過(guò)大無(wú)法打開(kāi)的文字,所以可能是這個(gè)文件過(guò)大導致Idea沒(méi)有加載,所以代碼無(wú)法補全。 在idea.properties中增加下面配置之后重啟Idea發(fā)現可以補全了。 idea.max.intellisense.filesize=6000 ......
idea
|
2024-12-01
0 評論
429 瀏覽
Capacity調度器源碼解析
簡(jiǎn)介 源碼解析 Capacity 調度器的核心類(lèi)是CapacityScheduler。在初始化CapacityScheduler的時(shí)候,在構造函數initAsyncSchedulingProperties,里面會(huì )初始化調度器相關(guān)。 核心類(lèi)是AsyncSchedulingConfiguration,主要內容總結為:初始化異步調度器線(xiàn)程AsyncScheduleThread,可以初始化多個(gè),調度支持多線(xiàn)程。 AsyncScheduleThread繼承自Thre ......
hadoop
|
2024-11-04
0 評論
326 瀏覽
router啟動(dòng)詳解
簡(jiǎn)介 為了解決HDFS的水平擴展性問(wèn)題,社區從Apache Hadoop 0.23.0版本開(kāi)始引入了HDFS federation。HDFS Federation是指 HDFS集群可同時(shí)存在多個(gè)NameNode/Namespace,每個(gè)Namespace之間是互相獨立的; 單獨的一個(gè)Namespace里面包含多個(gè) NameNode,其中一個(gè)是主,剩余的是備,這個(gè)和上面我們介紹的單Namespace里面的架構是一樣的。這些Namespace共同管理整個(gè)集群的數 ......
hadoop
|
2024-10-10
0 評論
514 瀏覽
hadoop 主備倒換控制器:ZKFailoverController詳解
簡(jiǎn)介 HDFS的NameNode、Yarn的ResourceManager都是依靠ZK實(shí)現主備倒換的。核心的類(lèi)為:ZKFailoverController.java, 選舉的核心類(lèi)為ActiveStandbyElector.java 主備選舉 主備選舉的核心類(lèi)是ActiveStandbyElector。在初始化的時(shí)候需要創(chuàng )建zk連接并且嘗試在zk上面創(chuàng )建文件。在創(chuàng )建連接或者創(chuàng )建文件的時(shí)候都會(huì )有回調事件。 回調處理的函數主要包含: 創(chuàng )建node節點(diǎn)回調 入口函 ......
hadoop
|
2024-09-22
0 評論
595 瀏覽
Hadoop 認證模塊詳解
客戶(hù)端認證 客戶(hù)端的入口函數為 KerberosAuthenticator.authenticate函數 連接HTTP服務(wù)端 HttpURLConnection conn = token.openConnection(url, connConfigurator); conn.setRequestMethod(AUTH_HTTP_METHOD); conn.connect(); SPNEGO認證 對于普通的HTTP的kerberos認證(SPNEGO),需要 ......
hadoop
|
2024-09-01
0 評論
866 瀏覽
ContainerManager詳解
簡(jiǎn)介 ContainerManager主要負責NM中管理所有Container生命周期,其主要包含啟動(dòng)Container、恢復Container、停止Container等功能。 主要功能由ContainerManagerImpl類(lèi)實(shí)現,具體代碼可以參考當前類(lèi)。 初始化 初始化主要分為兩部分: ContainerManagerImpl實(shí)例的構造函數和serviceInit函數。 構造函數 當前函數為構造函數,主要初始化必須要的一些變量等。 dispatche ......
hadoop
yarn
|
2024-08-01
1 評論
798 瀏覽
BPServiceActor詳解
簡(jiǎn)介 BPServiceActor 主要在DataNode中用于和NameNode溝通的類(lèi)。主要功能如下: 與 namenode 進(jìn)行預注冊握手。 向 namenode 注冊。 定期向 namenode 發(fā)送心跳。 處理從 namenode 收到的命令。 核心功能 BPServiceActor的入口函數為start函數,當前類(lèi)本身為runnable接口的實(shí)現類(lèi),所以在start函數里面新建了BPServiceActor線(xiàn)程,并且將其啟動(dòng), 所以其真實(shí)的啟 ......
hadoop
|
2024-07-21
0 評論
1,333 瀏覽
【Hadoop】【持續更新】hdfs 常見(jiàn)命令
常見(jiàn)命令記錄,總結篇
hadoop
轉載
|
2023-11-29
0 評論
2,296 瀏覽