Así se monitorea la salud de los servidores que ejecutan Apia
Resumen:
El Network Operations Center (NOC) de STATUM administra y opera cientos de servidores.
It applies to:
El Network Operations Center (NOC) de STATUM está conformado por cinco técnicos que cubren 12 horas de servicio (de 8 a 20 horas) de lunes a viernes, además realizar guardias para atender urgencias en un régimen de 7*24, los 365 días del año. Desde allí, se administran, operan y monitorean los servidores que ejecutan software basado en Apia; la mayoría es Linux. "Monitoreamos la salud del sistema, de las redes y de los enlaces", ilustró Pablo Suárez, coordinador del Centro de Operaciones. La conexión con los servidores remotos se hace mediante VPNs o enlaces MPLS dedicados.
El cliente de mayor dimensión es AGESIC, puesto que el NOC de STATUM debe administrar cientos de servidores que brindan servicios a decenas de organismos públicos. "Son los que le dan vida al expediente electrónico del Estado uruguayo mediante la solución ApiaDocumentum y a los trámites en línea mediante la solución Apia Trámites en Línea", agregó Suárez.
El equipo trabaja de forma proactiva para hacer lo necesario en el menor tiempo posible: desde la actualización de un servicio hasta la aplicación de un parche o el reinicio de la memoria de un servidor. "Monitoreamos miles de indicadores sobre cientos de servidores", afirmó. Luego se trabaja a solicitud del cliente y en coordinación con el departamento de Desarrollo de STATUM. Cualquier cambio en el sistema pasa por el NOC dado que sus cinco integrantes son "los únicos" que tienen acceso a los servidores.
Respecto a la metodología de trabajo, el NOC se basa en la Information Technology Infrastructure Library (ITIL), un conjunto comprensible y consistente de mejores prácticas para los procesos de gestión de servicios que promueve un enfoque de calidad para alcanzar la efectividad y eficiencia en el uso de TI.
Todos los requerimientos que llegan al NOC se canalizan a través de los llamados "tickets", que son los que dan el puntapié para las tareas. Estos representan números únicos con los que se identifican y trazan los requerimientos durante toda su vida (desde la apertura al cierre).
Parar lograr la estabilidad de los sistemas y el control de los cambios, el equipo del NOC recibe el "ticket" y elabora un plan acorde a él. Se evalúa el impacto de la solución y se da forma a un plan detallado que debe ser validado por el cliente. Luego se ensaya en un ambiente no productivo. Si la solución propuesta es correcta, se pasa a producción. Esto minimiza la tasa de errores.
En particular, estas son las tareas del NOC de STATUM:
- Administración rutinaria de servidores y servicios asociados
- Monitorización de salud de servidores y servicios asociados
- Instalación y actualización de software de base de los servidores
- Instalación y actualización de software de aplicación basado en Apia
- Modificaciones en la configuración del software libre y propietario
- Descarga a demanda de logs, archivos de configuración y otros
- Ejecución a demanda de scripts en bases de datos
- Realización a demanda de relevamientos y reportes
- Colaboración con otras áreas y otros proveedores durante maniobras
- Elaboración de recomendaciones técnicas y participación en proyectos
- Realización de respaldos periódicos de la información crítica
- Análisis y diagnóstico de problemas en producción
- Mantenimiento de sitios de contingencia
- Realización de guardias a la orden.
El Network Operations Center (NOC) de STATUM administra y opera cientos de servidores.
It applies to:
- Apia.
El Network Operations Center (NOC) de STATUM está conformado por cinco técnicos que cubren 12 horas de servicio (de 8 a 20 horas) de lunes a viernes, además realizar guardias para atender urgencias en un régimen de 7*24, los 365 días del año. Desde allí, se administran, operan y monitorean los servidores que ejecutan software basado en Apia; la mayoría es Linux. "Monitoreamos la salud del sistema, de las redes y de los enlaces", ilustró Pablo Suárez, coordinador del Centro de Operaciones. La conexión con los servidores remotos se hace mediante VPNs o enlaces MPLS dedicados.
El cliente de mayor dimensión es AGESIC, puesto que el NOC de STATUM debe administrar cientos de servidores que brindan servicios a decenas de organismos públicos. "Son los que le dan vida al expediente electrónico del Estado uruguayo mediante la solución ApiaDocumentum y a los trámites en línea mediante la solución Apia Trámites en Línea", agregó Suárez.
El equipo trabaja de forma proactiva para hacer lo necesario en el menor tiempo posible: desde la actualización de un servicio hasta la aplicación de un parche o el reinicio de la memoria de un servidor. "Monitoreamos miles de indicadores sobre cientos de servidores", afirmó. Luego se trabaja a solicitud del cliente y en coordinación con el departamento de Desarrollo de STATUM. Cualquier cambio en el sistema pasa por el NOC dado que sus cinco integrantes son "los únicos" que tienen acceso a los servidores.
Respecto a la metodología de trabajo, el NOC se basa en la Information Technology Infrastructure Library (ITIL), un conjunto comprensible y consistente de mejores prácticas para los procesos de gestión de servicios que promueve un enfoque de calidad para alcanzar la efectividad y eficiencia en el uso de TI.
Todos los requerimientos que llegan al NOC se canalizan a través de los llamados "tickets", que son los que dan el puntapié para las tareas. Estos representan números únicos con los que se identifican y trazan los requerimientos durante toda su vida (desde la apertura al cierre).
Parar lograr la estabilidad de los sistemas y el control de los cambios, el equipo del NOC recibe el "ticket" y elabora un plan acorde a él. Se evalúa el impacto de la solución y se da forma a un plan detallado que debe ser validado por el cliente. Luego se ensaya en un ambiente no productivo. Si la solución propuesta es correcta, se pasa a producción. Esto minimiza la tasa de errores.
En particular, estas son las tareas del NOC de STATUM:
- Administración rutinaria de servidores y servicios asociados
- Monitorización de salud de servidores y servicios asociados
- Instalación y actualización de software de base de los servidores
- Instalación y actualización de software de aplicación basado en Apia
- Modificaciones en la configuración del software libre y propietario
- Descarga a demanda de logs, archivos de configuración y otros
- Ejecución a demanda de scripts en bases de datos
- Realización a demanda de relevamientos y reportes
- Colaboración con otras áreas y otros proveedores durante maniobras
- Elaboración de recomendaciones técnicas y participación en proyectos
- Realización de respaldos periódicos de la información crítica
- Análisis y diagnóstico de problemas en producción
- Mantenimiento de sitios de contingencia
- Realización de guardias a la orden.
Comentarios (0)
Deja un comentario