Articles of procesamiento de text

Bash convertir cadena a una serie de cadenas?

Tengo una cadena como esta: 8080 "ac ac df asd" 9019 "fv adfs" 1 "123 da 123x" ¿Hay alguna forma inteligente de convertir esto en matrices como esta usando Bash? 8080 "ac ac df asd" 9019 "fv adfs" 1 "123 da 123x"

AWK: ¿dónde está mi error?

Tengo un file con : campos delimitados. Si el tercer campo de una línea es mayor que 22, esa línea debe imprimirse en el file44 . El file se ve así: 1:2:3:4 1:2:3:411 1:2:33:42 1:2:3:44444 1:2:3:4333333333 1:2:3:41 command awk awk -F: '$3 > 22 { print $0 > file44 }' file pero dame este error […]

Procesamiento de text por lotes de scripting

A menudo me encuentro tratando de hacer manipulaciones de text triviales en files bastante grandes. Parece que debería haber una forma de guionizar esto con una u otra de las varias herramientas de manipulación de text de Unix, pero no puedo entender exactamente cómo. Como ejemplo concreto, supongamos que tengo un código fuente que se […]

Con awk, cómo insert un número solo para las líneas que comienzan con "Toto" cuando se encuentran entre un par específico de patrones

Con awk, me gustaría insert una numeración como Record n°i# delante de cada línea comenzando con Toto solo cuando están ubicadas entre dos patrones específicos start=ABCD y stop=EFGH . El file de input es: (el Blabla puede ser cualquier cosa en realidad) Blabla Toto Blabla Blabla Toto Toto Blabla ABCD Toto Blabla Toto Blabla Blabla […]

Modificar cadena si el original no coincide con una cadena en particular

Tengo un file con millones de filas y quiero modificar los valores en la columna A solo si la cadena es '.'. La modificación sería agregar "chr:"$2":"$3 al comienzo de la cadena. Todas las otras filas se imprimirían como la versión original. Ejemplo de input: ABCDEFGH rs125 2 5433 T TACA A 3 2 chr2:4543 […]

herramientas de edición de flujo: salida de lo que se raspó

Me preguntaba si era posible utilizar diferentes herramientas de edición de flujo y procesamiento / manipulación de text; como grep, cut, sed, awk, perl, etc. ¿Hay forms de mostrar (en forma de file o STDOUT) el inverso de la salida (para decirlo de otra manera, lo que nunca se extrajo al ejecutar el command) de […]

Descubra las cadenas más frecuentes en la sección del file

Tengo un file que se ve así: o99 ksad <tab> abcde $%! H $! ( <Tab> 00 ! sdaf como <tab> 12 sarwa &! §! &% (donde <tab> representa un caracter TAB real). Para aclarar: contiene dos "columnas", el segundo podría estar completamente vacío, el primero podría contener espacios y varios símbolos. Por ejemplo, las […]

Simular el command de lectura sed con awk

Quiero estimular el uso de sed : sed '3r awk.scr' awk.script con awk.scr : a b cdef y awk.script como: hello there is hello i'am there is hello sdfdf dfdfdf aads 23213 3 434 Usando awk aquí: awk 'BEGIN {while((getline gf < "awk.script") > 0) {print gf; if(++i > 2) break;} {while((getline bf < "awk.scr")> […]

Línea de retorno conditonalmente en la siguiente línea

Estoy tratando de devolver una list de direcciones IP para computadoras que tienen un sistema operativo Windows (para mi curso de security). El resultado está en este formatting Nmap scan report for 192.168.xx.xxx Host is up (0.066s latency). PORT STATE SERVICE 139/tcp open netbios-ssn 445/tcp open microsoft-ds MAC Address: Host script results: | smb-os-discovery: | […]

Reemploop de cadenas calculado dinámicamente con herramientas estándar

¿Existe un mecanismo de UNIX para replace dinámicamente las cadenas coincidentes, con una function de la cadena coincidente? Por ejemplo, supongamos que quiero replace las coincidencias URL con sus contrapartes codificadas en URL o convertir ciertas coincidencias de snake_case a camelCase, o solo las mayúsculas? Ruby tiene gsub método gsub que toma una lambda ("un […]