Giám sát container là hoạt động liên tục thu thập số liệu, theo dõi tình trạng sức khoẻ của các ứng dụng container hoá và môi trường microservices, để cải thiện tình trạng sức khoẻ, nâng cao hiệu suất cũng như đảm bảo ứng dụng được vận hành thông suốt. Container được xem là một trong các phương pháp triển khai ứng dụng phổ biến nhất, mang lại nhiều lợi ích như giúp doanh nghiệp tăng cường tính khả chuyển của ứng dụng và khả năng phục hồi hoạt động.
Trong một khảo sát năm 2018 của Cloud Native Computing Foundation (CNCF), 73% số doanh nghiệp được khảo sát cho biết họ hiện đang sử dụng container để đẩy mạnh khả năng thích ứng, đổi mới trong sản xuất. Giám sát container là một phần của observability (quan sát) – một thuật ngữ thường được dùng song song với thuật ngữ giám sát, bao gồm các yếu tố như tổng hợp và phân tích file log, truy dấu, thông báo và hiển thị dữ liệu. Các giải pháp giám sát hiện đại vượt trội hơn các giải pháp truyền thống ở khả năng theo dõi các sự cố tiềm ẩn, cũng như thông tin chi tiết về hành vi container.
Bài viết này sẽ chỉ ra nguyên nhân, thời điểm và phương pháp phù hợp để bạn tiến hành giám sát container, cũng như những thách thức và giải pháp mà bạn có thể tìm ra.
Table of Contents
Vì sao cần phải giám sát container?
Việc có cái nhìn chuyên sâu và toàn diện về số liệu metrics, log và trace mang đến lợi ích lớn cho những lập trình viên sử dụng các nền tảng container.
Doanh nghiệp có thể đưa ra những quyết định sáng suốt, chẳng hạn như khi nào cần nâng cấp/mở rộng các instance/task/pod, chuyển đổi loại instance, hoặc lựa chọn hình thức thanh toán phù hợp (theo nhu cầu sử dụng – on demand, đặt trước – reserved hoặc đặt giá thầu – spot). DevOps và kỹ sư hệ thống cũng có thể cải thiện hiệu suất, tốc độ phân giải bằng cách bổ sung quy trình tự động hóa, chẳng hạn như dùng cảnh báo để tự động kích hoạt các hoạt động mở rộng quy mô.
Cụ thể, bằng cách chủ động theo dõi mức sử dụng tài nguyên bộ nhớ, bạn có thể xác định một ngưỡng để thông báo cho các người dùng khi mức tiêu thụ tài nguyên tiệm cận giới hạn, hoặc bạn cũng có thể áp dụng tự động hóa cho phép thêm vào các node bổ sung trước khi hết dung lượng CPU hoặc dung lượng bộ nhớ khả dụng. Trong trường bạn đặt ra một ngưỡng cảnh báo, chẳng hạn tại mức sử dụng 70%, bạn cũng có thể tự động thêm các instance vào cụm khi đạt ngưỡng.
Những thách thức với giám sát container
Mặc dù việc sử dụng container trong hoạt động triển khai ứng dụng đã trở nên phổ biến, khảo sát năm 2018 của CNCF cũng đã chỉ ra rằng 34% người được hỏi cho biết giám sát là một trong các thách thức hàng đầu ảnh hưởng tới việc áp dụng container. So với việc sử dụng giải pháp giám sát truyền thống cho hạ tầng ảo hoá, thì việc áp dụng hệ thống giám sát container sẽ kèm theo nhiều thách thức mới, bao gồm:
Container không tồn tại lâu
Chúng có thể được cung cấp nhanh chóng, nhưng cũng bị huỷ nhanh không kém. Hành vi này là một trong những ưu thế chính để sử dụng container, nhưng mặt khác nó lại gây ra khó khăn để theo dõi những thay đổi, đặc biệt là trong các hệ thống phức tạp với độ chính xác cao.
Container chia sẻ tài nguyên
Các tài nguyên như bộ nhớ và CPU được chia sẻ trên một hoặc nhiều máy chủ, gây khó khăn cho việc theo dõi mức tiêu thụ tài nguyên trên máy chủ vật lý, dẫn đến khó để chỉ dấu rõ ràng về hiệu suất container hoặc sức khỏe ứng dụng.
Bộ công cụ không đáp ứng đủ
Các nền tảng giám sát truyền thống, kể cả những nền tảng phù hợp với môi trường ảo hóa, vẫn có khả năng không cung cấp đủ thông tin chi tiết về số liệu, log và trace cần thiết để theo dõi và khắc phục sự cố về sức khỏe và hiệu suất của container.
Bạn cần gì ở một hệ thống giám sát container
Một hệ thống giám sát hiệu quả cần cung cấp được cái nhìn tổng quan về toàn bộ ứng dụng của bạn cũng như thông tin liên quan về từng thành phần. Dưới đây là những điều cần xem xét khi chọn giải pháp giám sát container:
- Liệu bạn có quan sát được toàn bộ ứng dụng đang hoạt động như thế nào, đối với cả hoạt động kinh doanh cũng như nền tảng kỹ thuật?
- Liệu bạn có thấy sự tương quan giữa sự kiện diễn ra và log, để phát hiện các bất thường và phản ứng một cách chủ động, hoặc thụ động, với sự kiện đó và giảm thiểu thiệt hại không?
- Liệu bạn có thể đi sâu vào từng thành phần hoặc từng lớp để phân tách và xác định nguồn gây ra sự cố không?
- Việc thêm các công cụ đo vào code có dễ dàng không?
- Việc định cấu hình cho cảnh báo, báo động và tự động hoá có dễ không?
- Liệu bạn có thể hiển thị, phân tích và đặt cảnh báo về bất kỳ số liệu hoặc log thu thâp được từ các nguồn dữ liệu khác nhau không?
Giải pháp giám sát từ FPT Monitoring
FPT Monitoring cung cấp giải pháp toàn diện thu thập, phân tích và cảnh báo trên các dữ liệu Metric, Logs, và Traces tích hợp với công cụ hiển thị dữ liệu dashboard cao cấp; giúp doanh nghiệp nhanh chóng phát hiện hành vi bất thường, cài đặt cảnh báo, trực quan hóa dữ liệu, thực hiện các thao tác tự động,…. khám phá thông tin chuyên sâu để ứng dụng của bạn vận hành ổn định.
Bộ công cụ trực quan hóa chuỗi dữ liệu nguồn mở Grafana là một lựa chọn phù hợp trong nhiều tình huống vì nó hỗ trợ nhiều nguồn dữ liệu khác nhau, bao gồm Prometheus, Graphite, cùng nhiều nguồn khác. Mặc dù tính năng cốt lõi của Grafana được sử dụng để trực quan hoá và cảnh báo các số liệu. Hỗ trợ việc phân tích log với các nguồn dữ cho phép người dùng tương quan số liệu với các sự kiện log, cũng như cung cấp phân tích nguyên nhân gốc. Bên cạnh Grafana còn có nhiều giải pháp giám sát container trả phí, nhưng chúng thường yêu cầu sử dụng các tác nhân hoặc giao thức thu thập dữ liệu cụ thể.
Lợi ích mà dịch vụ FPT Monitoring mang lại cho khách hàng bao gồm:
- Hệ thống quản trị được thiết kế với mục tiêu hoạt động ổn định và dễ dàng sử dụng cho các bộ phận khác nhau mà không cần kiến thức chuyên sâu về kỹ thuật
- Hệ thống có thể thu thập nhiều kiểu dữ liệu của ứng dụng và các bộ phận khác trong doanh nghiệp nhằm giúp quản trị và tối ưu trong quá trình phát triển sản phẩm trên hệ thống FPT Cloud
- Doanh nghiệp có thể quản trị và giám sát tài nguyên sử dụng trên hệ thống với những thông báo chuyên sâu về hiệu năng để từ đó có những biện pháp tối ưu vận hành và chi phí
Đối với các ứng dụng container hóa chạy trên tài nguyên FPT Cloud, trải nghiệm giám sát nguồn dữ liệu chéo tương tự có thể được thực hiện với FPT Monitoring. Bằng cách tự động thu thập và lưu trữ các số liệu và log, FPT Monitoring có thể cung cấp cho bạn cái nhìn sâu sắc về các cụm container của bạn và các ứng dụng đang chạy. Với FPT Monitoring, doanh nghiệp có thể dễ dàng quản lý hệ thống, tối ưu tài nguyên cũng như linh hoạt trong việc quản lý chi phí với tính năng Pay-as-you-go của FPT Cloud.
Liên hệ với chúng tôi để được tư vấn về sản phẩm FPT Monitoring
Fanpage: https://www.facebook.com/fptsmartcloud/
Email: [email protected]
Hotline: 1900 638 399
FPT Smart Cloud – Nhà cung giải pháp và tư vấn hàng đầu về Điện toán đám mây và Trí tuệ nhân tạo tại Việt Nam.