Elasticsearch 復原卡在 99%?對付 Translog「釘子戶」的四種殺手鐧
當 ES 節點重啟後,復原進度卡在 99% 死都不動,通常是因為 Translog 回放速度追不上新的寫入速度。本文詳解 Peer Recovery 機制,並提供 Flush、歸零副本、加大頻寬等四招實戰解法。
#Elasticsearch
#SRE
#Troubleshooting
當 ES 節點重啟後,復原進度卡在 99% 死都不動,通常是因為 Translog 回放速度追不上新的寫入速度。本文詳解 Peer Recovery 機制,並提供 Flush、歸零副本、加大頻寬等四招實戰解法。
為了節省資源,我們常透過 RPM 安裝一次 ES,並利用環境變數啟動多個 Node。但當你要用 CLI 重置密碼時,卻發現工具讀不到設定檔。本文解析為什麼你需要 set -a source。
Elasticsearch 的 System Indices 受到特殊保護,即使是 admin 權限也無法直接刪除,導致 ILM 報錯卡死。本文解析 allow_restricted_indices 參數的關鍵作用。