На площадке ведущего ИТ-форума Дальнего Востока Russky MeetUp&Digital Region (12+) во Владивостоке, посвященного развитию информационных технологий, состоялась запись подкаста "Русский Диджитал" (12+) с ведущим инженером Управления по развитию и эксплуатации компании Nexign Денисом Сохранным. Темой разговора стали примеры возникающих аварий и инцидентов, а также способы их устранения, пока пользователи ничего не заметили. Подробнее о том, что же кроется за завесой той самой фразы "Наши специалисты уже занимаются вашей проблемой", рассказывает ИА PrimaMedia.
Российская компания Nexign более 30 лет разрабатывает софт для телекома и другие IT-продукты. Nexign — место, в котором был создан первый биллинг в России, выпущены универсальные механизмы для low-code конструирования продуктов, а также получили развитие решения для эффективных бизнес-процессов.
Цифровые продукты Nexign, согласно современным тенденциям, носят не монолитный характер, а скорее представляют собой набор микросервисов с различными подсистемами. В зависимости от потребностей и желаний заказчика компания может предложить закрыть как все задачи разом, так и их часть. В команде Nexign насчитывается более 2000 экспертов, которые точно знают, как сделать лучше, и доказывают это с каждым новым проектом. Брать на себя инициативу и быстро принимать решения им не только не страшно, но и очень интересно.
"Russky MeetUp для Nexign — важное IT-событие Дальнего Востока. Во Владивостоке находится филиал нашей компании, и поэтому нам очень важно понимать, чем живет регион, как обстоят дела со специалистами, какие тренды можно наблюдать в местном IT-сообществе. Участие в форуме — отличная возможность закрыть сразу несколько запросов. Помимо того, что мы являемся крупным работодателем и заинтересованы в поиске лучших сотрудников, мы также предоставляем софт для команд разработки. На Russky MeetUp можно как рассказать о наших продуктах, так и вдохновиться в рамках обмена экспертизой", — рассказали в Nexign.
Подкаст с ведущим инженером Управления по развитию и эксплуатации компании Nexign Денисом Сохранным. ИА PrimaMedia
Теми самыми людьми, которым приходится, словно пожарным, в условиях "всё упало, всё горит" каждый раз решать новые сложные задачи со множеством неизвестных, в Nexign являются специалисты отдела поддержки. Именно ею, а конкретно саппортом для клиентов телеком-отрасли, и занимается герой интервью — Денис Сохранный.
"У нас всё большое: огромные бизнес-процессы, сложные системы. Над внедрением какой-то новой фичи работает целая команда аналитиков, оценивая, не поломается ли что-то другое, и как это повлияет на остальные процессы. Собственно, пишут этот код и эксплуатируют его люди. Все люди рано или поздно ошибаются, что-то идет не по плану. И вот тут и появляется моя команда саппорта. Мы имеем доступ к стендам наших заказчиков, к их системам, проводим анализ и отвечаем на два главных вопроса: "Кто виноват?" и "Что делать?". Не мы ищем проблемы. Проблемы сами находят нас, а мы пытаемся их решить", — говорит Денис.
Его команда занимается минимизацией негативного влияния возникших ошибок, выявлением их причин, формированием постоянного или временного решения для устранения неполадок. И в этом очень много человеческого фактора. Главное, считает Денис, понять, что мы все несовершенны, все совершаем ошибки, и идеально никогда не бывает.
"В принципе, на всей территории России невозможно ни отправить смс, ни позвонить, ни выйти в интернет, так или иначе не соприкоснувшись с продуктами нашей компании. Крупные федеральные операторы выбирают те или иные решения Nexign. Кто-то в меньшей степени, кто-то в большей. Наши продукты есть и у операторов в СНГ, в Армении, Грузии и так далее", — отмечает Денис.
В сфере IT, как известно, большую роль играет терминология. И здесь важно провести разграничение терминов "авария" и "инцидент". Команда Дениса занимается именно инцидент-менеджментом в сфере телекоммуникаций, то есть помогает справляться с инцидентами — случаями, когда какой-либо сбой или ошибка отмечаются уже у нескольких абонентов и могут носить системный характер, но еще не массовый. Так, например, операторы колл-центра фиксируют несколько обращений по одинаковой проблеме. Формируется инцидент и отправляется в отдел поддержки Nexign. Здесь его анализируют и ищут пути решения.
Подкаст с ведущим инженером Управления по развитию и эксплуатации компании Nexign Денисом Сохранным. ИА PrimaMedia
В зависимости от договоренностей с клиентом Nexign может оказывать поддержку в различных форматах. Если договор предполагает инцидент-менеджмент, то помощь оказывается круглосуточно.
"Всего у нас есть четыре смены поддержки. Две из них работают во Владивостоке, в моем отделе, а еще две — в Самаре. Это очень удобно: мы оказываем круглосуточную поддержку, и если здесь, во Владивостоке, мы не успели решить задачу, мы передаем ее таким же ребятам в Самаре. Они ее подхватывают и начинают работать. Так мы и работаем — два дня через два", — рассказал Денис.
В случае других договоренностей с заказчиком поддержка оказывается не через инцидент-менеджмент, а через тикеты. Это значит, что после установки системы компанией Nexign специалисты выходят на связь в другом режиме по заранее оформленным тикетам — заявкам с вопросами, уточнениями или просьбами.
Какими бы ни были условия, стресса в работе отдела поддержки предостаточно. Его добавляют и строгие временные рамки, в которые должна быть решена та или иная возникшая проблема. С каждым заказчиком подписывается SLA (Service Level Agreement) — соглашение о том, какие, когда и как будут предоставляться услуги. Например, максимальный срок на решение проблемы может составлять двое суток. В условиях, когда каждый новый инцидент — словно новая загадка со своими неизвестными, работа отдела поддержки превращается действительно в экстремальный труд.
Подкаст с ведущим инженером Управления по развитию и эксплуатации компании Nexign Денисом Сохранным. ИА PrimaMedia
Даже если сроки по договору еще не поджимают, важно понимать, что с каждой минутой количество абонентов, столкнувшихся с проблемой, растет, а заказчик теряет прибыль. Значит, решение проблемы должно найтись молниеносно. И в тот самый момент, когда многие сотрудники схватились бы за сердце, отдел поддержки радостно потирает руки в ожидании интересной работы на адреналине.
"Необходимость починить всё до того, как 100% пользователей успеют заметить, что что-то сломалось, — моя любимая ситуация. И здесь очень кстати, что мы работаем во Владивостоке. Мы оторваны на семь часов от центральной части России, где живет большая часть населения. И получается, мы работаем, когда все спят. И вот ты сидишь субботним утром, попиваешь кофе, и тут приходит инцидент, в котором написано о трех абонентах с проблемой. Ты проводишь анализ и понимаешь, что абонентов не три, а 333 тысячи. И сейчас они все проснутся. Это очень плохо. И тут появляемся мы, за ночь всё чиним, абоненты просыпаются и даже не знают о том, что произошло. Это просто идеальная ситуация, когда мы словно Белка и Стрелка за ночь всё решили и всех спасли", — поделился Денис.
К сожалению, не всегда можно решить задачу за одну ночь. Тогда подключаются дополнительные уровни решения инцидентов. Помимо инцидент-менеджмента, которым занимается отдел Дениса, в Nexign существует проблем-менеджмент. Он необходим в тех случаях, когда какие-то инциденты воспроизводятся с одинаковым интервалом. Тогда их объединяют в проблему и отправляют в работу.
"На третьем уровне подключаются разработчики, проводят аналитику и предлагают байпас — решение в духе: "Если вдруг это повторится, то делайте вот это и это, и вы всех спасете", — говорит Денис.
Работа службы поддержки заключается не только в решении возникших проблем. Немало сил уходит и на их предупреждение. Например, установка любой новой версии или подсистемы несет в себе риск ошибки или какой-либо поломки. Какие бы ни были проверки, тесты, тестовые среды, все равно что-то может пойти не так, могут возникнуть обстоятельства непреодолимой силы. И вот после установки новой подсистемы служба поддержки также работает во всю мощь.
Подкаст с ведущим инженером Управления по развитию и эксплуатации компании Nexign Денисом Сохранным. ИА PrimaMedia
"Например, одна из моих любимых историй, как мы очень долго сидели в чате, потому что в глухой сибирской тайге в ЦОДе (дата-центре — прим. ред.) сломалось охлаждение, серверы начинали постепенно нагреваться, а это была одна из ключевых площадок. Нас собрали для подготовки переезда на резервную площадку, потому что вот-вот температура поднимется настолько, что всё упадет, серверы начнут выключаться. И пока мы готовили переезд, ребята в чате писали, мол, это же Сибирь, зима, откройте окно! Всё быстро охладится. А там нет окна, там невозможно ничего открыть", — рассказал Денис, приводя пример обстоятельств непреодолимой силы.
Нередко случается и так, что проблема может возникать по вине стороннего сервиса, однако изначально она все равно поступает в службу поддержки.
"У нас есть постоянный мониторинг, за которым мы следим. Есть видеостена с разными графиками. По падению какого-нибудь графика мы видим, что, например, упала система приема платежей. Мы понимаем, что уже через полчаса к заказчику придут недовольные абоненты, а он создаст нам инцидент. Вполне возможно, что упала система вовсе даже не из-за нас, а потому, что у банка где-то что-то пошло не так, ведутся какие-нибудь работы, о которых нас забыли предупредить. Но в любом случае мы пытаемся всё выяснить, связаться с банком, оценить возможное влияние инцидента. В общем, мы всё берем на себя", — отмечает Денис.
Ситуация может быть разной. Возможна техническая ошибка, а может быть, бизнес внедрил новую идею, но она не сочетается с другими. Такое, кстати, бывает нередко. Интересы бизнеса и техподдержки, которая ему помогает, в этом вопросе расходятся.
"У нас действительно есть так называемый мораторий, когда всем запрещают накатывать новые версии. Хотя бизнес очень хочет, ведь в них всякие новые фишечки, которые помогут нашему заказчику увеличить прибыль. Но есть периоды, например, перед Новым годом, примерно за пару недель, когда им запрещают это делать. Ведь в это время кто-то в одно лицо будет круглосуточно работать и пытаться спасти всё, что упало, а разработчики будут отдыхать. Также действуют запреты и на другие праздники, чтобы не тревожить абонентов и сотрудников", — рассказал Денис.
Казалось бы, IT-компании как никто другой должны применять самые современные и технологичные подходы для решения возникающих задач. Например, активно применять нейросети, заменяя ими человеческий ресурс. Но насколько это эффективно? Оказывается, следить за нейросетями все еще должен человек, заменить которого на 100% в настоящий момент нельзя.
Подкаст с ведущим инженером Управления по развитию и эксплуатации компании Nexign Денисом Сохранным. ИА PrimaMedia
"У нас есть целый продукт, в котором нейросеть анализирует графики в системе мониторинга. Опираясь на данные за предыдущие периоды, она делает анализ и пытается найти аномалии и нас об этом предупредить. Но бывает так, что происходит действительно что-то странное. Мы видим проблему заранее и стараемся ее решить. Но случается и так, что сегодня просто праздники, и утром 1 января люди действительно меньше звонят, но ничего не упало", — говорит Денис.
Несмотря на сложности своей работы, Денис Сохранный уверенно признается, что ни за что бы ее не поменял.
"Такая вот интересная у меня работа. Я бы сказал, что мы больше детективы. Пришел инцидент, заиграла музыка из "Криминальной России", у абонентов все выключилось, и мы побежали искать, кто же в этом виноват. Конечно, для этого нужен определенный склад ума. Саппорт — это работа для тех, кому нужен стресс. Мне нравится моя работа, я уже девять лет в саппорте. Это прекрасная работа, я бы ни за что ее не поменял. Она, конечно, нервная, но зато как в том анекдоте про палача: "Черт возьми, работа-то на воздухе, работа-то с людьми!". Каждый день тебе приходит какая-то новая задача, как загадка, и ты должен ее решить. Варианта ее не решить просто нет. Если ты не справишься, ты подключишь другого специалиста. Если мы все не справимся, мы подключим мудрейших, но задача точно будет решена", — уверенно отметил Денис.
Russky MeetUp&Digital Region (12+) — традиционный цифровой форум, посвященный развитию информационных технологий на Дальнем Востоке. Он объединил в себе форматы деловой программы, стратегических дискуссий, форсайт-сессий, презентаций кейсов и обсуждения лучших практик и неформального общения на важные темы между специалистами разнообразных отраслей.
Мероприятие посвящено вопросам внедрения лучших digital-решений и практик цифровой трансформации, модернизации технологий и содержания обучения в IT области, создания цифровой образовательной среды. Форум призван приблизить решение задач по обеспечению комфортной жизни на Дальнем Востоке за счет реализации современных цифровых проектов и их интеграции в реальный сектор.
Организаторами мероприятия выступают Правительство Приморского края, Дальневосточный федеральный университет, сеть информационных агентств PrimaMedia. Официальный партнер форума — ПАО "Ростелеком".
Реклама. Рекламодатель: АО "НЭКСАЙН", ИНН 7801019126.