Odin cung cấp 2 công cụ để monitor hệ thống cluster là thông qua web và command line.
Hôm nay chúng ta sẽ tiến hành monitor Cluster bằng command line thông qua lệnh ” pstorage -c cluster_name top ”
Hôm nay chúng ta sẽ tiến hành monitor Cluster bằng command line thông qua lệnh ” pstorage -c cluster_name top ”
Lưu ý: Cluster_name là tên cluster của hệ thống.
#pstorage -c ods top
Bên trên là thông tin tổng quan về hệ thống cluster. Có thể chia ra thành 5 phần: tổng quan thông tin chung, MDS server, CS server, Client và Log của cluster.
Tiếp theo chúng ta sẽ phân tích sâu vào từng thành phần để nắm rõ về các thông số monitor cung cấp.
Phần 1: Tổng quan thông tin chung.
Ở phần này, monitor sẽ cung cấp cái nhìn tổng quan nhất về các thông số chung của cluster như: Name, Space cluster, số lượng MDS và CS, Replication, License, IO ….
Tham Số | Mô Tả |
---|---|
Cluster | Tên của cluster. Lưu ý tình trạng Healthy, ở đây thể hiện Cluster hiện tại đang hoàn toàn ổn định. Vui lòng xem thêm tại đây về các thông báo trạng thái khác của cluster. |
Space | Thể hiện dung lượng thật hiện có của cluster (VD: free 4.45TB of 4.50TB là tổng dung lượng toàn bộ các disk trong cluster), Allocatable 1.44TB (+688.9GB unlicensed) of 2.25TB: thể hiện dung lượng thật có thể sử dụng tối đa của cluster là 2.25TB. Tuy nhiên vì mới chỉ active license storage là 1.5TB nên cần phải mua thêm license ~700GB storage để có thể sử dụng hết 2.25TB. |
MDS nodes | Số lượng MDS Nodes đã tạo trên cluster. |
CS Nodes | Số lượng CS Nodes đã tạo trên cluster. Chi tiết vui lòng xem tại đây. |
License | Tình trạng license,ngày hết hạn, cũng như dung lượng thật của license mà cluster có thể dùng. |
Replication | Thông số Replication đang được cấu hình trên cluster. |
Chunks | Các trạng thái chunk trên cluster (tính theo % tổng số chunk đang có trên cluster). Lưu ý các thông số như healthy,degraded,urgent,.. Ở đây tình trạng của healthy là 100% thể hiện tất cả các chunk đã được replication hoàn tất. Chi tiết các thông số có thể xem tại đây. |
FS | Tổng dung lượng thật sự của các chunk trên cluster cũng như số lượng chunk replicas. |
IO | Tốc độ thật về Input/Output của cluster. |
IO Total | Tổng dung lượng đã đọc và ghi của cluster. |
Repl IO | Tốc độ Replication của Cluster. |
Sync rate và IO QDEPTH | Hai tham số này thể hiện tốc độ đồng bộ dữ liệu trên cluster cũng như tốc độ IO trung bình và cao nhất của cluster trong qúa trình hoạt động. |
Tham Số | Mô Tả |
---|---|
MDS ID | Mỗi MDS khi tạo trên cluster đều có 1 ID riêng để xác định. Ký tự “M” trước ID MDS bất kỳ thể hiện MDS server đó là master MDS vì một thời điểm chỉ có 1 MDS đảm nhận Master còn lại đều là Slaver. |
STATUS | Tình trạng hiện tại của MDS server (Avail thể hiện tình trạng MDS này đang hoạt động tốt) |
%CTIME | Tổng lượng thời gian MDS server cần để ghi lên journal local. |
COMMIT | Mỗi MDS đều có 1 ID riêng để xác định trên cluster. Ký tự “M” trước ID MDS bất kỳ thể hiện node MDS đó là master MDS. |
%CPU | Lượng % CPU MDS đang sử dụng. |
MEM | Lượng bộ nhớ RAM vật lý mà MDS đang sử dụng. |
UPTIME | Tổng thời gian MDS đã online từ lần khởi động gần nhất. |
HOST | Địa chỉ HOST của MDS. |
Phần 3: CS server
Đây là phần tổng quan về CS server, các tham số quan trọng trên hệ thống cluster. Lưu ý là có thể dung phím “i” để chuyển đến các tab thông tin chi tiết hơn về CS server.
Đây là phần tổng quan về CS server, các tham số quan trọng trên hệ thống cluster. Lưu ý là có thể dung phím “i” để chuyển đến các tab thông tin chi tiết hơn về CS server.
Tham Số | Mô Tả |
---|---|
CS ID | Mã ID duy nhất của mỗi CS trên cluster. |
STATUS | Tình trạng hiện tại của CS. Các thông số chi tiết về CS có thể xem tại đây. |
SPACE | Đây là dung lượng trống của tất cả các disk trên chunk server. |
AVAIL | Tổng dung lượng có thể ghi trên từng disk. |
REPLICAS | Tổng số lượng chunk đang được phân phát và lưu trên từng disk. |
IOWAIL | Phần trăm lượng Input/Output trên từng disk. Lượng IO Wailt này nếu qúa cao sẽ ảnh hưởng đếnhiêu năng của node và cluster. (IOWAIT dao động liên tục từ 0 ~ 50% được xem là tình trạng tốt, nếu cao hơn thể hiện Chunk server này đang quá tải performance, cần thêm disk hoặc chunk server mới) |
IOLAT | Thể hiện thời gian Trung bình/tối đa (tính theo milliseconds) mà CS cần để thực hiện xong 1 tiến trình I/O. (IOLAT trung bình trong khoảng 0 ~ 200 ms được xem là tình trạng tốt, nếu cao hơn thể hiện Chunk server này đang quá tải performance, cần thêm disk hoặc chunk server mới) |
FLAGS | Đây là những cờ quan trọng xác định các CS đang ở trạng thái nào. Chi tiết có thể xem tại đây. J : cờ J thông báo là CS hiện tại đang sử dụng tính năng write journal. C: cờ này dùng để checksum data có bị chỉnh sửa bởi 1 phần mềm bên ngoài nào đó không ( bảo đảm tính toàn vẹn của data ) D: cờ này thể hiện CS đang sử dụng tốc độ I/O thật của nó. Không dùng write journal. c: cờ này thể hiện dung lượng hiện tại của journal hiện đang trống. Không có hoạt động nào tác động write journal nào từ SSD đến HDD nơi CS được đặt. |
Phần 4 : Client
Tham Số | Mô Tả |
---|---|
CL ID | Mã ID duy nhất của mỗi Client trên cluster. |
LEASE | Số lượng file trung bình các file đã được mở dành cho qúa trình đọc ghi và số lượng các file hiện tại vừa được đóng. |
READ | Tỉ lệ trung bình bao nhiêu byte dữ liệu client có thể đọc theo giây. |
WRITE | Tỉ lệ trung bình bao nhiêu byte dữ liệu client có thể ghi theo giây. |
RD_OPS | Trung bình thời gian client thực hiện một tiến trình đọc giây. |
WR_OPS | Trung bình thời gian client thực hiện một tiến trình ghi theo giây. |
FSYNCS | Trung bình thời gian client thực hiện 1 tiến trình đồng bộ theo giây. |
IOLAT | Trung bình thời gian tính bằng miliseconds mà client cần để thực hiện hoàn tất một tiến trình I/O. |
HOST | Tên hoặc IP của client. |
Phần 5: Event Log
Trong phần event log cung cấp log về các tiến trình đã và đang hoạt động trong hệ thống. Log là 1 phần rất quan trọng của hệ thống. Chi tiết vui lòng xem bài viết phân tích về event log tại đây.
0 comments:
Post a Comment