La vida de un denunciante o revelador de secretos no es sencilla e incluye el tomar múltiples medidas de seguridad para no ser descubierto, por empresas y agencias gubernamentales.
Evitar dejar una huella digital en los textos es una de ellas. En ocasiones documentos y otros tipos de archivos se distribuyen a múltiples individuos con sutiles modificaciones, inapreciables a simple vista, pero que permiten identificar al receptor del mismo, en caso de una fuga de información.
SafeText es un script construido en lenguaje de programación Python, que permite sanitizar texto y evitar ese problema.
SafeText elimina los caracteres zero-with space (ZWSP), unas fuentes no visibles que sirven para delimitar las palabras de texto y el control de los saltos de linea.
También los homoglifos. En este caso se trata de caracteres muy similares, provenientes de diferentes fuentes tipográficas y alfabetos. Como ejemplos sencillos de homoglifos podríamos citar: la letra O y el número 0; ó lo fácil que es confundir en determinados casos, la letra i mayúscula («I») con la ele («l») minúscula.
Usar SafeText es muy fácil, tan solo tenemos que descargar el archivo zip desde su página de GitHub y descomprimirlo.
A continuación entramos con la terminal en la carpeta SafeText-master y ejecutamos:
python safetest.py nombre_archivo
En mi caso, he creado un archivo de prueba y lo he embadurnado un poco a ver que pasaba:
[jose@replicante SafeText-master]$ python safetext.py secret.txt [*] Cleaning test.txt to test.txt.safe ... [!] FOUND HOMOGLYPHIC CHARACTER CYRILLIC_e ON LINE 1 [!] FOUND HOMOGLYPHIC CHARACTER CYRILLIC_small_h ON LINE 1 [!] FOUND HOMOGLYPHIC CHARACTER CYRILLIC_s ON LINE 1 [!] FOUND HOMOGLYPHIC CHARACTER GREEK_I ON LINE 1 Ι'ⅴе... ѕееn tһⅰngs you people wouldn't believe... [!] FOUND a SPACE ON LINE # 4 Near the Tannhäuser* Gates. [*] Output file closed
Si ejecutáis el programa, observaréis que se crea un nuevo archivo de tipo seguro (safe), que elimina esas peculiaridades.
En el archivo zip descargado encontraréis además del programa en si, un pequeño documento (TestFile.txt) con el que realizar vuestras propias pruebas.
Tenéis más información sobre SafeText en su página de GitHub.
¿No es suficiente con poner «ONLY YOUR EYES» en el documento? 😛
@Cehora:
Your comment is been monitoring pending further investigation.
Regards, NSA.
😉
«identificar al receptor del mismo»
¿Es correcto?
Supongo.
Identificar al receptor «legal», al que luego lo filtra. Evidentemente, al filtrarlo se convierte en emisor/remitente, pero su primer papel ha sido el de receptor.
Para ampliar información sobre esta técnica de fingerprinting:
* https://www.zachaysan.com/writing/2017-12-30-zero-width-characters
* https://www.zachaysan.com/writing/2018-01-01-fingerprinting-update
Y aunque no directamente relacionado, creo que esto viene al caso:
https://www.eff.org/es/deeplinks/2017/06/puntos-de-seguimiento-de-impresion-de-nuevo-las-noticias