48Bits Blog » Blog Archive » En ocasiones… veo patrones…

Random IRC quote :

En ocasiones… veo patrones…

Un día mientras analizaba un firmware me puse a hacer un pequeño script en python para convertir un archivo cualquiera a una imagen y así poder analizar «visualmente» un fichero para ver la entropía del mismo así como las diferentes partes de un archivo. Por ejemplo, visualizando un firmware, se puede ver fácilmente donde está el código del bootloader y donde está el código comprimido y/o cifrado, como en la siguiente imagen:

Firmware de un router Zyxel sin desempacar

En esta imagen podemos ver como en la parte inicial donde se ven más «rayitas» y «coloritos» está el código del bootloader, una pequeña sección de datos con mucha entropía (código comprimido), una sección llena de carácteres FFh (la parte en negro) y el código real del firmware, comprimido (la mayor parte del archivo).

En el script lo único que hago es leer cada byte del archivo dado como entrada y convertir grupos de 3 bytes en colores RGB, es decir, el primer byte será el código para el «Red», el segundo byte para el «Green», el tercer byte para el «Blue» y así sucesivamente.

También es útil, por ejemplo, para ver ejecutables y sus secciones de recursos, como en la siguiente imagen del programa IceSword donde se ve perfectamente la espada:

Imagen del IceSword

Posibles usos

Uno de los usos interesantes, además de para ver ficheros y buscar patrones como si fuéramos enfermos mentales (soy un polvo borracho según mi madre 🙁 ) puede ser, por ejemplo, para codificar un fichero en una imagen, es decir, para esteganografía. El contenido del fichero, al completo, se codifica como una imagen ocultando (de un modo un poco txapuzas) la verdadera naturaleza del fichero a envíar.

Otro uso más, para el que ya se ha utilizado esto es para comprobar si un generador de números aleatorios es realmente aleatorio o no buscando patrones en la imagen que salga. Es decir, se pone a funcionar el generador de números aleatorios indicándole que nos devuelva «0» o «1» y nosotros dibujamos un pixel negro o un pixel blanco en función de que nos ha devuelto. Un ejemplo de uso real se muestra aquí, en el que se demuestra la debilidad de la función Rand() de PHP de versiones ya bastante viejas:

Imagen de un pseudo generador de números aleatorios que funciona bien

Imagen de un PRNG que es un "Fail!" como una catedral

El código de este pequeño script en Python es el siguiente:

#!/usr/bin/python

import os
import sys

from math import sqrt
from PIL import Image

def main(bin, filename):
buf = open(bin, "rb").read()
size = int(sqrt(len(buf))*0.5)

img = Image.new("RGB", (size, size), "red")
putpixel = img.putpixel
i = 0

for y in range(int(size)):
for x in range(int(size)):
if i > len(buf) or len(buf)-i <= 3:
break

value = (ord(buf[i:i+1]), ord(buf[i+1:i+2]), ord(buf[i+3:i+4]))
i += 3
putpixel((x, y), value)

img.save(filename)
os.system("start " + filename)

def usage():
print "Usage:", sys.argv[0], " "

if __name__ == "__main__":
if len(sys.argv) != 3:
usage()
else:
main(sys.argv[1], sys.argv[2])

Por: matalaz | 06/30/10 | Noticias | Trackback | Comentarios [RSS 2.0]

17 Comentarios para “En ocasiones… veo patrones…”

NCR

Comment por NCR | 06/30/10 at 10:20 am

Muy bueno! me gusto! Una vuelta de tuerca interesante!
vierito5

Comment por vierito5 | 06/30/10 at 10:35 am

Muy bueno! Un PRNG malo te desmonta por completo un sistema criptográfico.

Es una pifia parecida a usar un el moco ECB en los cifrados. No lleva realimentación de los resultados entre bloques y en un análisis como este se podrían ver perfectamente los diferentes bloques.

Hoy he visto este enlace y me ha parecido curioso:
http://smokedchicken.org/2010/06/ida-entropy-plugin.html
Dreg

Comment por Dreg | 06/30/10 at 1:14 pm

Ostia, molan estas movidas 🙂
Ruben

Comment por Ruben | 06/30/10 at 3:36 pm

Muy chulo!

El visualizar este tipo de datos ayuda mucho, no recuerdo ahora quien era el que lo hizo pero habia una herramienta para visualizar el comportamiento del heap de aplicaciones concretas para desarrollo de exploits.

El de http://www.dumpanalysis.org/ también tiene una cosas del estilo para visualizar dumpeados de memoria.
neofito

Comment por neofito | 06/30/10 at 3:40 pm

Muy interesante, y gracias por compartir el script.

Saludos

PD: Por cierto Ruben, te refieres a esto, ¿verdad?
miK

Comment por miK | 06/30/10 at 3:57 pm

Qué curioso :-O
matalaz

Comment por matalaz | 06/30/10 at 4:04 pm

@Ruben

Dices esta herramienta: http://www.coresecurity.com/content/open-source-projects#HeapDraw

Es de Gerardo Richarte, como no 🙂
tmeto

Comment por tmeto | 07/01/10 at 2:57 am

Pues esta util el tema este……pero como te de por mirar mucho rato una cosa de estas te llaman al telefono y 7 dias despues mueres que lo he visto yo en una peli…

Gracias por el script!

pd: soy el unico que en la primera imagen ve a cristo!?!?!?!
Ruben

Comment por Ruben | 07/01/10 at 7:25 am

xDDDDDDDDDDDDDDDDDDDDDDDD
haztelo mirar «tmeto»
Newlog

Comment por Newlog | 07/01/10 at 7:55 am

Muy bueno lo de los números aleatorios!
kerrigan29a

Comment por kerrigan29a | 07/01/10 at 11:50 am

Una cosa que he visto en el código. Porque –> size = int(sqrt(len(buf)) * 0.5) size += 10 size = int(sqrt(len(buf) / 3)) <–
Es decir, 166128/3 (porque agrupas los bytes en tripletas) y luego la raíz cuadrada para conseguir el lado del cuadrado

Como he dicho, puede que no lo haya entendido yo. Si es así perdón por las molestias ( agradecería que me lo explicases).
matalaz

Comment por matalaz | 07/02/10 at 2:21 am

@kerrigan29a

Sí, tienes razón, el código no estaba bien. Es lo que tiene escribirlo al vuelo 🙂
Ya está corregido, muchas gracias!
pancake

Comment por pancake | 07/02/10 at 7:34 am

Esto radare lo hace dsd hace 2 anyos polomenos y en interactivo con el zoom mode (Vz) o con «!rsc Display» (tira de imagemagick).

Este tipo de analisis tb es util para detectar tamaños de claves ciclicas de cifrado, alineamientos en strides en ficheros de video (mjpeg) etc.. lo usé para recuperar un video de una camara de seguridad con un disco jodido hace tiempo.
cristhian

Comment por cristhian | 07/05/10 at 5:52 am

Yo siempre he tenido la idea de que esto de los patrones se podía utlilizar como algoritmo de compresión.
Os imagináis poner a un programa a buscar patrones, no ya bidimensionales, como en las imagenes, sino n-dimensionales, y que la compresión resultante fuese un número pequeño de funciones a partir de las cuales se pudiera obtener el archivo original?
Os imagináis poder comprimir un blu-ray en un archivo de 10 megas? Estaría guay eh!
ps-el

Comment por ps-el | 05/08/11 at 1:47 am

Después de leer este post me dió por utilizar el script para generar ficheros como imagenes y luego hacer otro que hiciera el trabajo inverso, desde la imagen recuperará el fichero original. Haciendo esto me di cuenta de que el script tiene un pequeño fallo.

> ord(buf[i:i+1]), ord(buf[i+1:i+2]), ord(buf[i+3:i+4])

debería ser

> ord(buf[i:i+1]), ord(buf[i+1:i+2]), ord(buf[i+2:i+3])

Se esta saltando 1 de cada 3 bytes.
ps -el

Comment por ps -el | 05/20/11 at 9:11 am

Os adjunto el código que convierte de binario a imagen (que es prácitamente calcado al del post) y el que convierte de imagen a binario otra vez. No son lo mejor del mundo pero funciona con bmp y png

bin2jpg.py

#!/usr/bin/python
import sys

from math import sqrt
from PIL import Image

def main(bin, filename):
buf = open(bin, «rb»).read()
size = int(sqrt(len(buf)/3))
leakInSize = len(buf) – (size * size * 3)

leakPoints = (leakInSize/ 3)
if leakInSize % 3 != 0: leakPoints += 1

size_y = 0
if leakPoints % size != 0: size_y = (leakPoints / size) + 1
if leakPoints % size == 0: size_y = (leakPoints / size)
size_y += size

img = Image.new(«RGB», (size, size_y), «red»)
putpixel = img.putpixel
i = 0

for y in range(int(size_y)):
for x in range(int(size)):
if i >= len(buf):
break
if len(buf) -i < 2 :
value = (ord(buf[i:i+1]), 3 ,3)
elif len(buf) -i < 3 :
value = (ord(buf[i:i+1]), ord(buf[i+1:i+2]),3)
else:
value = (ord(buf[i:i+1]), ord(buf[i+1:i+2]), ord(buf[i+2:i+3]))
i += 3
putpixel((x, y), value)
img.save(filename)

def usage():
print "Usage:", sys.argv[0], " file_origen file_destination"

if __name__ == "__main__":
if len(sys.argv) != 3:
usage()
else:
main(sys.argv[1], sys.argv[2])

jpg2bin

#!/usr/bin/python

import os
import sys

from PIL import Image
import binascii

def main(jpg, bin):
img = Image.open(jpg)
(size_x, size_y) = img.size

file = open(bin, «wb»)
res = «»
num_reds = 0
for y in range (size_y):
for x in range (size_x):
pixel = img.getpixel((x,y))
if pixel == (255,0,0) and (y == size_y -1):
num_reds+=1
else:
num_reds = 0
if num_reds > 2: break
value = ‘%02x%02x%02x’%( pixel[0],pixel[1],pixel[2])
res += value
binaryData = res[:-12]
if binaryData[-2:] == «03»: binaryData = binaryData[:-2]
if binaryData[-2:] == «03»: binaryData = binaryData[:-2]
file.write (binascii.a2b_hex(binaryData))
file.close()

def usage():
print «Usage:», sys.argv[0], » file_origen file_destination»

if __name__ == «__main__»:
if len(sys.argv) != 3:
usage()
else:
main(sys.argv[1], sys.argv[2])
ps -el

Comment por ps -el | 05/20/11 at 9:26 am

En la vista previa estaba bien tabulado, 🙁

En ocasiones… veo patrones…

17 Comentarios para “En ocasiones… veo patrones…”

Se han cerrado los comentarios