¿Cómo puedo usar awk para extraer las URL de un file HTML?

Tengo un file HTML con javascript y CSS en la fuente. Enumerado en el JS hay una serie de URL 'integradas con otros metadatos. Quiero utilizar awk para extraer las URL (todas incluidas en comillas dobles con el prefijo http: //) y volcar las URL a stdout. Pero no sé cómo usar awk, pero parece ser la herramienta para usar.

{ title: "Dsssat", artist: "cxpl djij awsoj e", mp3: "http://somesite.com/seal/dsssat.mp3", }, 

Puedes usar grep . Para include las comillas dobles:

 grep -o '"http://[^"]*"' myfile.html 

Para excluir las comillas dobles:

 grep -o 'http://[^"]*' myfile.html 

Editar

Es posible que desee realizar un mayor filtrado para asegurarse de que solo coincida con las URL en los objects de JavaScript:

 grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o '"http://[^"]*"' grep -o 'mp3: "http://[^"]*"' myfile.html | grep -o 'http://[^"]*' 

¿Por qué usar awk? sed es mejor en esto:

 sed -ne 's/.*\(http[^"]*\).*/\1/p' < foo.js