buen libro de solución de problemas de Unix

He estado tratando de aprender * nix y creo que estoy yendo bastante bien en cuanto a commands básicos, y creo que entiendo muchos de los commands de tipo "monitoreo", etc. … en resumen, creo que estoy haciendo bien con cosas de tipo syntax.

Y hacer cosas como la configuration de xyz es más o less directo … pero realmente quiero empezar a aprender cómo hacer es solucionar problemas / diagnosticar problemas y ser capaz de solucionarlos. Por ejemplo, si voy a mi website y no se carga … ¿cuál sería la primera cosa que debería verificar? Esa class de cosas.

Así que pensé que probablemente hay algunos buenos libros sobre qué hacer cuando las cosas van mal, qué search, cómo identificar qué está pasando y cómo solucionarlo, etc., así que estaba buscando algunas recomendaciones sobre dónde Debería recurrir a eso?

Idealmente, me gustaría recibir recomendaciones de libros porque estoy pasado de moda y me gusta poder tener algo en mis manos, pero también para situaciones de lectura en el baño 🙂

¿Algún buen libro por ahí? Hice un poco de investigación antes de publicar aquí … pero después de un time de intentar ver varios libros, me quedó claro que actualmente soy un novato para averiguar si el libro que estoy recibiendo realmente me va a dar lo que busco … parece que la mayoría de los libros que he visto hasta ahora se centran en la installation, la copy de security y la syntax general … pero eso es fácil y directo de digerir … Estoy buscando las cosas que me ayudarán a ser un mejor detective y solucionador de problemas de * nix …

ps – Actualmente estoy usando CentOS 5.3, pero por lo que puedo decir, muchas cosas son genéricas y pueden funcionar desde el sistema * nix hasta el sistema * nix, así que no creo que necesariamente necesite que sea centOS específico …

Editar:

Terminé obteniendo 3 libros:

Biblia de resolución de problemas de Linux

Hacks de serveres Linux

Linux Server Hacks, Volumen 2 (no se puede publicar el enlace debido a las restricciones de publicación, pero puede encontrarlo fácilmente desde el primer enlace)

    No hay ningún libro sobre este tema que yo sepa, usted obtiene solución de problemas de experiencia al hacerlo. Se vuelve mejor en la solución de problemas ya que comprende cómo funcionan todos los diferentes componentes de un sistema.

    En el ejemplo que proporcionó de un website que no se carga, he visto la siguiente causa que esto sucede (la list no es exclusiva):

    • DNS no resolviendo
    • dominio caducado
    • partición se quedó sin espacio
    • Apache intenta escribir en un file de logging que no existe o no tiene permissions
    • server se quedó sin RAM
    • apache no se está ejecutando
    • memcached está abajo
    • mysql está abajo
    • mysql está arriba, pero sobrecargado
    • Apache está llegando a MaxClients
    • alguien cambió algo en el código y se rompió
    • alguien actualizó su CMS y se rompió
    • permissions incorrectos en los files
    • .htaccess ha cambiado
    • algún process está acaparando todos los resources del server
    • algún package en el sistema que el website necesita fue cambiado, actualizado o eliminado

    En lo anterior, puede verificar los problemas de caducidad de DNS y dominio con dig y whois. Cuando visitas el server, ¿parece lento y rezagado? Algo probablemente esté usando los resources del sistema.

    Apache está corriendo? Puedes ver si está llegando a MaxClients con pgrep httpd | wc -l pgrep httpd | wc -l pero ¿por qué está golpeando MaxClients ahora? Se está ejecutando MySQL? ¿Cuántas consultas se están ejecutando? ¿Tardan mucho time?

    ¿Alguien cambió los files? CD a los sitios web de inicio y ejecutar find . -mtime -2 find . -mtime -2 para ver qué ha cambiado en los últimos dos días. Mira en el logging de errores de tu sitio para ver si hay problemas. Mire en / var / log / messages para ver si hay problemas.

    Como puede ver, hay muchos componentes que necesitan trabajar juntos para que un website se cargue y usted necesita comprender cómo interactúan y cómo saber eliminarlos como posibles culpables de su problema. Saber cómo hacer esto viene a través de la experiencia. Es posible que termine persiguiendo a un pretext cuando se resuelve un problema, pero eso es lo que le da experiencia para el próximo problema. Si bien la amenaza no fue la causa de su problema, al less ahora comprende ese componente del sistema.