relación "baja" de deduplicación de zfs

En Solaris 11, en un grupo llamado mypool activé la deduplicación con

 zfs set dedup=on mypool 

Luego creé dos files de 100 MB: file1 y su copy file1copy . Solo sus nombres son diferentes: su contenido es el mismo.

El punto de assembly de mypool es /mypool . Si copio file1copy y file1copy en /mypool , el resultado de

 zpool list mypool 

indica una relación DEDUP de apenas 1.34x . ¿¿Por qué??

Luego, siguiendo esta guía, creé un sistema de files con

 zfs create -o dedup=on -o mypool/archive 

y luego los filesystems de dos usuarios, mypool/archive/a y mypool/archive/b que henetworkingaron la deduplicación del sistema de files padre.

Si ahora copio mypool/archive/a en mypool/archive/a y file1copy en mypool/archive/b aún hay una relación DEDUP de 1.34x . Se convierte en 2 solo si coloco el mismo file, digamos file1 , en mypool/archive/a y mypool/archive/b . ¿¿Por qué??

¿Puede una simple diferencia de nombre desmantelar fuertemente la deduplicación? ¿No debería la deduplicación actuar a nivel de bloque?


1) Salida de zdb -S mypool

 Simulated DDT histogram: bucket allocated referenced ______ ______________________________ ______________________________ refcnt blocks LSIZE PSIZE DSIZE blocks LSIZE PSIZE DSIZE ------ ------ ----- ----- ----- ------ ----- ----- ----- 1 1.48K 189M 189M 189M 1.48K 189M 189M 189M 2 800 100M 100M 99.9M 1.56K 200M 200M 200M Total 2.26K 289M 289M 288M 3.04K 389M 389M 388M dedup = 1.35, compress = 1.00, copies = 1.00, dedup * compress / copies = 1.35 

2) Salida de zdb -b mypool

 Traversing all blocks to verify nothing leaked ... No leaks (block sum matches space maps exactly) bp count: 3679 bp logical: 410970112 avg: 111707 bp physical: 408433664 avg: 111017 compression: 1.01 bp allocated: 615948288 avg: 167422 compression: 0.67 bp deduped: 157286400 ref>1: 800 deduplication: 1.26 SPA allocated: 458661888 used: 76.47% 

En las mypool/archive/a y mypool/archive/b también había otro file.

No todos los datos son "deducibles". Hay un artículo aquí que explica esto