Gitea 自建代碼倉流量大坑
背景 前端時(shí)間租的騰訊云服務(wù)器是按照流量計費的,最近一段時(shí)間流量走的老快了,并且發(fā)現默認1G的帶寬老是卡。 原因 通過(guò)分析nginx的日志發(fā)現有大量的爬蟲(chóng)在大批量的訪(fǎng)問(wèn)代碼倉。導致占用了大量帶寬。 解決 nginx中過(guò)濾爬蟲(chóng) 在nginx中配置下面信息,過(guò)濾掉大量爬蟲(chóng)的請求。 if ($http_user_agent ~ "(meta-externalagent|Amazonbot|ClaudeBot|Baiduspider|SemrushBot|bing ......
gitea
|
2025-03-09
0 評論
504 瀏覽
container-executor 詳解
簡(jiǎn)介 container-executor 是NodeManager管理Container很重要的一個(gè)工具,是深入學(xué)習Yarn作業(yè)調度不可缺少的一個(gè)知識點(diǎn),值得深入學(xué)習。本文只描述比較基礎的功能點(diǎn)(目前不會(huì )包含Docker相關(guān))。 核心功能點(diǎn) checksetup 主要是檢查container-executor的配置是否ok,沒(méi)有其他功能。核心代碼如下: case CHECK_SETUP: //we already did this exit_code ......
hadoop
|
2025-03-02
0 評論
221 瀏覽
Idea Hadoop 源碼YarnServiceProtos無(wú)法補全問(wèn)題
問(wèn)題現象 使用IDEA打開(kāi)Hadoop源碼之后,發(fā)現YarnServiceProtos部分代碼無(wú)法補全,已經(jīng)安裝了protobuf相關(guān)的插件。 原因以及解決方法 再打開(kāi)YarnServiceProtos文件的時(shí)候會(huì )提示類(lèi)似文件過(guò)大無(wú)法打開(kāi)的文字,所以可能是這個(gè)文件過(guò)大導致Idea沒(méi)有加載,所以代碼無(wú)法補全。 在idea.properties中增加下面配置之后重啟Idea發(fā)現可以補全了。 idea.max.intellisense.filesize=6000 ......
idea
|
2024-12-01
0 評論
339 瀏覽
Capacity調度器源碼解析
簡(jiǎn)介 源碼解析 Capacity 調度器的核心類(lèi)是CapacityScheduler。在初始化CapacityScheduler的時(shí)候,在構造函數initAsyncSchedulingProperties,里面會(huì )初始化調度器相關(guān)。 核心類(lèi)是AsyncSchedulingConfiguration,主要內容總結為:初始化異步調度器線(xiàn)程AsyncScheduleThread,可以初始化多個(gè),調度支持多線(xiàn)程。 AsyncScheduleThread繼承自Thre ......
hadoop
|
2024-11-04
0 評論
236 瀏覽
router啟動(dòng)詳解
簡(jiǎn)介 為了解決HDFS的水平擴展性問(wèn)題,社區從Apache Hadoop 0.23.0版本開(kāi)始引入了HDFS federation。HDFS Federation是指 HDFS集群可同時(shí)存在多個(gè)NameNode/Namespace,每個(gè)Namespace之間是互相獨立的; 單獨的一個(gè)Namespace里面包含多個(gè) NameNode,其中一個(gè)是主,剩余的是備,這個(gè)和上面我們介紹的單Namespace里面的架構是一樣的。這些Namespace共同管理整個(gè)集群的數 ......
hadoop
|
2024-10-10
0 評論
403 瀏覽
hadoop 主備倒換控制器:ZKFailoverController詳解
簡(jiǎn)介 HDFS的NameNode、Yarn的ResourceManager都是依靠ZK實(shí)現主備倒換的。核心的類(lèi)為:ZKFailoverController.java, 選舉的核心類(lèi)為ActiveStandbyElector.java 主備選舉 主備選舉的核心類(lèi)是ActiveStandbyElector。在初始化的時(shí)候需要創(chuàng )建zk連接并且嘗試在zk上面創(chuàng )建文件。在創(chuàng )建連接或者創(chuàng )建文件的時(shí)候都會(huì )有回調事件。 回調處理的函數主要包含: 創(chuàng )建node節點(diǎn)回調 入口函 ......
hadoop
|
2024-09-22
0 評論
506 瀏覽
Hadoop 認證模塊詳解
客戶(hù)端認證 客戶(hù)端的入口函數為 KerberosAuthenticator.authenticate函數 連接HTTP服務(wù)端 HttpURLConnection conn = token.openConnection(url, connConfigurator); conn.setRequestMethod(AUTH_HTTP_METHOD); conn.connect(); SPNEGO認證 對于普通的HTTP的kerberos認證(SPNEGO),需要 ......
hadoop
|
2024-09-01
0 評論
750 瀏覽
ContainerManager詳解
簡(jiǎn)介 ContainerManager主要負責NM中管理所有Container生命周期,其主要包含啟動(dòng)Container、恢復Container、停止Container等功能。 主要功能由ContainerManagerImpl類(lèi)實(shí)現,具體代碼可以參考當前類(lèi)。 初始化 初始化主要分為兩部分: ContainerManagerImpl實(shí)例的構造函數和serviceInit函數。 構造函數 當前函數為構造函數,主要初始化必須要的一些變量等。 dispatche ......
hadoop
yarn
|
2024-08-01
1 評論
608 瀏覽
BPServiceActor詳解
簡(jiǎn)介 BPServiceActor 主要在DataNode中用于和NameNode溝通的類(lèi)。主要功能如下: 與 namenode 進(jìn)行預注冊握手。 向 namenode 注冊。 定期向 namenode 發(fā)送心跳。 處理從 namenode 收到的命令。 核心功能 BPServiceActor的入口函數為start函數,當前類(lèi)本身為runnable接口的實(shí)現類(lèi),所以在start函數里面新建了BPServiceActor線(xiàn)程,并且將其啟動(dòng), 所以其真實(shí)的啟 ......
hadoop
|
2024-07-21
0 評論
1,089 瀏覽
【Hadoop】【持續更新】hdfs 常見(jiàn)命令
常見(jiàn)命令記錄,總結篇
hadoop
轉載
|
2023-11-29
0 評論
2,144 瀏覽
【Hadoop】ResourceManager簡(jiǎn)介
簡(jiǎn)介 ResourceManager(RM),RM是全局的資源管理器,負責整個(gè)系統的資源管理和分配。主要由以下兩部分組成: 調度器:根據容量、隊列限制條件將系統資源分配給各個(gè)應用。 資源分配的單位是container,container是一個(gè)動(dòng)態(tài)資源單位,它將內存、CPU、磁盤(pán)、網(wǎng)絡(luò )等資源封裝在一起,從而限定了資源使用量。 調度器是一個(gè)可插拔的組件,用戶(hù)可以自己定制,也可以選擇Fair或Capacity調度器. 應用程序管理器:負責管理所有應用程序的 ......
hadoop
|
2023-11-25
0 評論
2,038 瀏覽
neovim 從0開(kāi)始配置優(yōu)化
neovim是從vim的一個(gè)分支fork出來(lái)的,從性能等方面來(lái)講都比vim強很多,所以從vim轉到neovim了。 本文涉及的neovim配置都在https://git.zeekling.cn/linux/nvim-config/src/branch/master里面。 快速使用方法: ```bash git clone https://git.zeekling.cn/linux/nvim-config.git ~/.config/nvim # 或者 git ......
neovim
|
2024-06-09
2 評論
2,066 瀏覽
【Hadoop】FSDirectory詳解
Namenode最重要的兩個(gè)功能之一就是維護整個(gè)文件系統的目錄樹(shù)(即命名空間namesystem) 。 HDFS文件系統的命名空間(namespace) , 也就是以“/”為根的整個(gè)目錄樹(shù), 是通過(guò)FSDirectory類(lèi)來(lái)管理的。 FSNamesystem也提供了管理目錄樹(shù)結構的方法。 FSNamesystem中的方法多是調用FSDirectory類(lèi)的實(shí)現。FSNamesystem在FSDirectory類(lèi)方法的基礎上添加了editlog日志記錄的功能。 ......
hadoop
|
2024-03-31
0 評論
1,887 瀏覽
【Hadoop】Yarn 作業(yè)啟動(dòng)源碼解讀
作業(yè)啟動(dòng) 作業(yè)提交的客戶(hù)端比較核心的類(lèi)是Job.java,看作業(yè)啟動(dòng)的源碼需要從這個(gè)類(lèi)開(kāi)始看。 Job.java 作業(yè)啟動(dòng)的入口函數為waitForCompletion函數。當前函數的核心函數為submit(),主要如下: public void submit() throws IOException, InterruptedException, ClassNotFoundException { ensureState(JobState.DEFINE); s ......
yarn
hadoop
|
2023-12-07
1 評論
2,148 瀏覽
docker stop container 報錯:tried to kill container, but did not receive an exit event
問(wèn)題現象 執行docker stop xxxx報錯如下: Error response from daemon: cannot stop container: xxxx: tried to kill container, but did not receive an exit event 執行下面命令重啟docker,發(fā)現container依舊在,依舊無(wú)法停止。 systemctl restart docker 解決方案 通過(guò)docker ps查看co ......
Docker
|
2024-06-02
2 評論
2,005 瀏覽