COMANDOS MASIVOS CAUSAN INTERRUPCIÓN EN AMAZON AWS S3

Fecha actualización el 2017-3-3. Fecha publicación el . Categoría: Amazon. Autor: Mapa del sitio Fuente: bleepingcomputer

Amazon culpó de la interrupción masiva AWS S3 a un error tipográfico que se produjo el 28 de febrero

La causa raíz de todo el problema, segun Amazon es debida a un problema con el sistema de facturación S3 (Amazon Simple Storage Service) que se movía demasiado lentamente en la mañana del 28 de febrero.

Siguiendo los procedimientos internos, se llegó a la conclusión de que habia que eliminar algunos servidores del sistema de facturación S3. Para ello, se necesita ejecutar un comando de consola.

"Por desgracia, una de las entradas a la orden fue introducido incorrectamente y se eliminó un conjunto mayor de servidores de lo previsto", segun Amazon.

"Los servidores que inadvertidamente se eliminaron apoyaron otros dos subsistemas S3. Uno de estos subsistemas, el subsistema de índice, gestiona la información de metadatos y la ubicación de todos los objetos S3 en la región."

En términos simples, el empleado elimino accidentalmente uno de los servidores de AWS S3 que coordinaron el tráfico entre sus diferentes nodos.

Las consecuencias fueron inmediatas, ya que algunos sitios web descendieron por completo, mientras que otros sólo perdieron el acceso a los archivos multimedia almacenados en los servidores S3 ubicados en esa región en particular (el norte de Virginia EE.UU.-ESTE-1 Región).

Por otra parte, uno de los servidores afectados era la página de estado de cuenta de Amazon, que para la mayoría de la interrupción mostró que todo estaba funcionando sin problemas, aunque alrededor del 20% de todos los sitios de Internet se vieron afectados, de acuerdo con una estimación de Shawn Moore, director de tecnología de Solodev.

Para empeorar las cosas, reiniciar los servidores cruciales más de lo habitual, ya que se reinician muy raramente, y el equipo no estaba acostumbrado a pasar por todos los controles de seguridad a toda velocidad.

Amazon dice que está llevando a cabo algunos cambios para evitar una situación similar. Por ejemplo, al retirar los servidores (capacidad), los usos de Amazon herramienta no pasar por debajo de un cierto límite que pone en peligro el normal funcionamiento de toda la red S3.

Además, Amazon planea romper su red en células más pequeñas, por lo que un corte de luz como esto sólo afectará a un número menor de clientes. Esta operación fue planeada para el final del año, pero Amazon mueve ahora en la parte superior de la cola de prioridad.

El mes de febrero ha estado plagado de errores ortográficos. Un error en el código fuente de la criptomoneda Zerocash permite a un atacante desconocido para robar alrededor de 592.000 $. Del mismo modo, un error en un componente Cloudflare provocó una fuga masiva de datos para sus clientes, conocidos como CloudBleed .


Comenta y comparte en Compartir en Google+
Amazon AWS S3