Cloud Deployment

5 софтуерни инструменти, които ви трябват за облачната ви инфраструктура

Най-накрая сте успели да накарате програмата си да работи. И тя го прави чудесно. Вие сте щастливи и клиентите ви също.

Една сутрин се събуждате и установявате, че електронната ви поща е пълна с гневни писма от клиенти, а фийдът ви в Туитър е задръстен от оплаквания. Докато сте спали нещо се е объркало. А вие не разбрали, докато не сте си проверили пощата на сутринта.

Грабвате лаптопа и опитвате да отстраните проблема. След 20 минути всичко е наред и програмата отново работи. Беше толкова просто. Отне няколко минути да оправите нещата. Всъщност прекарахте повече време да търсите проблема.

Въпреки че всички искаме такива неща да не се случват, те продължават да се случват. Въпросът е как да намалим вероятността да се случват и как да възстановим програмата максимално бързо в случай на проблем.

В този пост съм съставил кратък списък на основните програмки и услуги, които нашите клиенти използват в облака ни за помощ в такива ситуации. Разбира се, тези инструменти не могат да заместят стабилността на инфраструктурата, но когато нещата се объркат, те ще ви помогнат бързо ги възстановите. В някои случаи, например ако мястото на сървъра е на привършване, инструментите могат да ви изпратят сигнал и така да предотвратят проблем.

Мониторинг: Munin

Макар инструменти като top (или htop)да са страхотни в показването на моментното натоварване на системата, често искате да видите развитието на натоварването във времето. Точно тук Munin влиза в картинката. Това е клиент/сървър услуга, която си инсталирате сами във всеки сървър, който искате да наблюдавате. Сървърът на програмата се свързва с всеки клиент и събира данни за специфичните параметри.

Munin идва с много плъгини за мониторинг, например за системните ресурси като оперативна памет, централния процесор, температура и други, но също така за много други услуги като MySQL и Postfix.

Една от силните страни на Munin е, че можете много лесно да си напишете сами плъгин. Можете да го направите на кажи-режи всеки език, като повечето плъгини се пишат на Bash, Perl или Python.

Munin може да бъде настроен да праща предупредитетлни сигнали на база на зададени гранични стойности в плъгините, но в сравнение с Nagios тези сигнали са доста ограничени като функция.

munin

Предупреждения: Nagios

  • Накратко: изпраща известия, когато критични ресурси откажат да работят
  • Вид: Self-hosted
  • Website: nagios.org
  • Алтернатива: Zabbix

Както споменахме по-горе, Munin има опция да изпраща предупреждения, но тази функционалност дори не се доближава до Nagios. Днес тази програма е стандарт в индустрията за мониторинг на вътрешните ресурси. Може и да не изглежда привлекателна на външен вид, но е много добра.

Подобно на Munin, Nagios е съврър/клиент вид услуга (макар клиентът да се изисква само за някои функционалности).

Може и да ви отнеме малко време да свикнете с конфигурацията на синтаксиса и структурата на Nagios, но веднъж овладеете ли я, програмата е сравнително лесна.

Проста Nagios настройка може да подсигури достъпността на сървърите ви през Ping, SSH и мрежата, но има огромно количество плъгини, достъпни за програмата, които ще ви помогнат за мониторинга на всичките ви услуги.

Nagios идва и с редица варианти за предупреждения. Най-простият е чрез изпращане на мейл, но може да ги настроите и през други канали, например SMS (използвайки външни услуги).

nagios

Външен мониторинг: Pingdom

  • Накратко: гарантира, че услугите ви са достъпни от целия свят
  • Вид: SaaS
  • Алтернатива: StatusCake
  • Website: pingdom.com

Nagios е страхотна за мониторинг на вътрешни ресурси, но не ви казва дали сайтът ви е недостъпен заради проблеми в маршрутизацията. Точно тук се намесва Pingdom. Има редица проверки, които може да направите с тази програмка, но най-простата е да се уверите, че сайтът ви отговаря на заявките.

С букета от сървъри по света на Pingdom може да спите спокойни, знаейки, че сайтът ви работи, както и какво е времето за отговор на заявките.

pingdom

Мониторинг на продуктивността на апликациите: New Relic APM

  • Накратко: предоставя данни за работата на апликациите и причината за проблема
  • Вид: SaaS
  • Алтернатива: Rollbar
  • Website: newrelic.com

Всички рано или късно попадат в ситуация, в която сайтът им започва да работи зле. Забелязват, че зарежда по-бавно и не знаят къде е проблемът, тъй като много неща могат да предизвикат подобно поведение.

Тук в играта влиза New Relic APM. С инсталирането му лесно може да се установи коренът на проблема.

Програмата иска достъп до апликациите ви, така че трябва да го интегрирате в тях. Повечето стандартни рамки за приложения се поддържат.

Благодарение на партньорството ни с производителя на New Relic APM – New Relic, можете да си отворите акаунт в програмата от нашето уеб-приложение, и да ползвате функции, които няма да може да използвате, ако се впишете директно от сайта им.

new_relic

Управление на предупрежденията: Big Panda

  • Накратко: прави възможно управлението на предупрежденията във вашия екип
  • Вид: SaaS
  • Website: bigpanda.io
  • Алтернатива: PagerDuty

Ако бизнесът ви е магазин, който управлявате сам, предупреждения по електронната поща може и да са достатъчни. Може и да се понатрупат, когато нещата се объркат, но ще приоритизирате.

Ако обаче работите в екип с много хора, на сцената изгрява Big Panda. С тази програмка можете да настроите изброените по-горе инструменти да докладват грешки и да изпращат предупреждения и в нея и да си направите виртуална дъска, в която да си разпределите задачите между хората в екипа.

bigpanda

Обобщение

Надявам се, че изброените инструменти са ви дали добра картинка за програмките, които могат да помогнат на облачната ви инфраструктура. Разбира се, има много други подобни програмки. Идеята е, че ви трябвало една във всяка от изброените категории.

Може да хвърлите едно око и на следната статия: “Сривове в облака – въведение”, която също ще ви помогне да нагласите настройките си, така че да избегнете често срещани сривове.