Elasticsearch 復原卡在 99%?對付 Translog「釘子戶」的四種殺手鐧
當 ES 節點重啟後,復原進度卡在 99% 死都不動,通常是因為 Translog 回放速度追不上新的寫入速度。本文詳解 Peer Recovery 機制,並提供 Flush、歸零副本、加大頻寬等四招實戰解法。
當 ES 節點重啟後,復原進度卡在 99% 死都不動,通常是因為 Translog 回放速度追不上新的寫入速度。本文詳解 Peer Recovery 機制,並提供 Flush、歸零副本、加大頻寬等四招實戰解法。
為什麼向量搜尋可以這麼快?HNSW 是目前最強的近似最近鄰搜尋演算法。本文透過「高鐵路網」的比喻,解析它的分層結構、鄰居選擇策略,以及 Elasticsearch 中的參數調優指南。
升級 ES 最怕 Split-Brain 或資料毀損。本文依照 Data Tiers 架構,拆解 Rolling Upgrade 的標準 SOP,從 Frozen Tier 到 Master Node,確保服務不中斷。
為了節省資源,我們常透過 RPM 安裝一次 ES,並利用環境變數啟動多個 Node。但當你要用 CLI 重置密碼時,卻發現工具讀不到設定檔。本文解析為什麼你需要 set -a source。
Elasticsearch 的 System Indices 受到特殊保護,即使是 admin 權限也無法直接刪除,導致 ILM 報錯卡死。本文解析 allow_restricted_indices 參數的關鍵作用。
Kafka 送來的 Log 格式千奇百怪,開發者今天傳字串、明天傳物件,SRE 該怎麼辦?本文深入解析 Elasticsearch Dynamic Templates 的 path_match 與 runtime 應用,打造一個「不炸裂」的日誌系統。
做 Log 分析時,我們習慣依賴 ES 的自動判斷;但在開發 App 時,選錯資料型別就是災難的開始。這篇筆記整理了 ES 9.0+ 關鍵型別,以及它們在系統設計中的真實應用場景。
在 elasticsearch.yml 裡,node.roles 決定了伺服器的命運。本文詳細拆解 11 種節點角色,並特別解析 remote_cluster_client 與跨叢集監控的迷思。