Criptografía - Historia de la criptografía

Texto en claro:	H	O	L	A	C	L	A	S	E
Texto cifrado:	K	R	O	D	F	O	D	V	H

Texto en claro:	H	O	L	A	C	L	A	S	E
Texto cifrado:	Z	S	N	R	G	E	S	W	G

Texto en claro:	H	O	L	A	C	L	A	S	E
Texto cifrado:	O	C	S	H	A	A	L	L	E

Tipo	Ejemplo	# de claves diferentes	Tamaño en bits
PIN de 4 números	3659	10000
4 letras mayúsculas	CASA	614656
4 letras + especiales	Ca*4	33362176	25 bits
5 letras + especiales	Ca*4S	2535525376	32 bits
41 letras + especiales	o18uIo=...9f89fdA!S		256 bits
54 mayúsculas	KJASWE...SAJKSAJF		256 bits
77 números	923821321...12998		256 bits

El manuscrito Voynich podría ser una broma de textos sin sentido. Los expertos parecen hacer descartado que el manuscrito Voynich tenga un cifrado simple como el César. Aún así, han analizado los textos y han encontrado que siguen pautas estadísticas de un lenguaje real. El misterio sigue abierto. Imagen: https://upload.wikimedia.org/wikipedia/commons/9/93/Voynich_Manuscript_%2832%29.jpg

¿Recordáis la máxima de Shanon y los principios de Kerckhoffs? "El adversario conoce el sistema". Es decir: los único que debe ser secreto (a parte del mensaje, claro) es la clave de cifrado/descifrado. Se tiene que asumir que el adversario conoce las funciones e() y d() Aún no estaban preocupados de identificar con quién estaban hablando: "si conoce la clave, será un interlocutor legítimo". Nota: ¿Cifrar o encriptar? En este curso llamaremos a la ciencia "criptogafía" y al acto "cifrado". Encontrarás gente que utiliza "encriptar" como sinónimo de "cifrar". La RAE ha aceptado recientemente el verbo "encriptar", pero la polémica sobre si usar o no ese verbo sigue abierta en nuestro sector.

Con "clásicos" queremos decir que se usaban desde tiempos del imperio egipcio, pasando por hebreos, griegos, romanos, edad media, edad moderna (incluidas las guerras mundiales)... es decir, desde que se inventó la escritura hasta ayer mismo. Estos dos métodos de cifrado se han utilizado durante miles de años, y nuestros algoritmos de cifrado simétrico actual aún los tienen como parte de sus pasos

Fíjate: - En el primer caso, las letras A y L siempre se cifran igual - En el segundo caso, las letras A y L se cifran diferente cada vez - En el tercer caso, son las mismas letras pero desordenadas El cifrado con XOR es un tipo de cifrado polialfabético

Recordad: la criptografía quiere mejorar la dispersión y la difusión del mensaje original. La transposición simple como la de la escítala ayuda en ambos casos. Prácticamente todos los algoritmos actuales de cifrado simétrico utilizan sistemas de transposición como uno de los pasos del cifrado. Imagen: https://upload.wikimedia.org/wikipedia/commons/5/51/Skytale.png

Desde tiempos de los romanos, el cifrado por excelencia hasta la década de los '70 ha sido algún tipo de cifrado por sustitución más o menos complejo. Los estudiaremos a continuación con más detalle en el resto de capítulos Imagen: https://upload.wikimedia.org/wikipedia/commons/2/2b/Caesar3.svg

Gracias a la ayuda de los computadores modernos podemos hacer redes complejas pero, en esencia, seguimos haciendo permutaciones y sustituciones

Es muy posible que César utilizase sistemas más complejos de cifrado que no conocemos: "There is even a rather ingeniously written treatise by the grammarian Probus concerning the secret meaning of letters in the composition of Caesar's epistles." — Aulus Gellius, Attic Nights 17.9.1–5 Imagen: https://upload.wikimedia.org/wikipedia/commons/8/8f/Gaius_Iulius_Caesar_%28Vatican_Museum%29.jpg

En las transparencias que siguen, asumimos que el alfabeto es el latino y solo hay 26 posibles letras

El descifrado césar sigue exactamente el mismo algoritmo que el cifrado, pero usando una clave diferente. Esto pasará a menudo: la función de cifrado (o al menos algunos de los pasos de la función de cifrado) es muy parecida a la función de descifrado. Esto es una enorme ventaja porque nos permite utilizar los mismos programas, o parte de los mismos, para cifrar y descifrar: - menos errores, al reutilizar código - si usamos hardware especializado, podemos reaprovecharlo en el envío y la recepción

Observación en el César clásico, de media, tenemos que probar solo 13 claves: ¡la mitad!

José Ramón Cuesta, archivero, investigador y escritor, que explica que el mensaje "está codificado mediante el sistema de sustitución simple o de letras emparejadas". Para poder interpretarlo hay que sustituir cada letra por su par. Cada vez que aparece una a hay que sustituirla por una eme, la be por una ene y la ce por una o. Y así de forma sucesiva. Es decir, es un César con k=12. Fíjate en algunas curiosidades típicas en el ámbito militar para simplificar el proceso de cifrado manual: "no tiene en cuenta la uve, sustituida por la be, que es representada por la ene. Tampoco consta la ka ni la eñe. La u sirve para representar tanto la i latina como la i griega." Estas simplificaciones de letras dependen de la lengua original. Fíjate también que para interpretar el texto necesitas información de contexto, porque son telegramas y no novelas. Estas características (letras de menos, jerga) ya no las estudia la criptografía moderna aunque sí que sean necesarias para interpretar correctamente un mensaje, y fueron importantes para descifrar textos en el pasado. Por ejemplo con la máquina enigma, como veremos más tarde. Además, la forma del papel sugiere que estaba oculto en algún sitio y tenía esa forma para que no fuese reconocible. Sí que hay un rama de la criptografía moderna que estudia cómo ocultar un mensaje: la esteganografía.

Estos no son exactamente sistemas de cifrado, pero nos sirven para explicar lo que es la fuerza bruta. ¿Cómo abrirías la cerradura de la puerta? ¿Cómo puede un ladrón utilizar una tarjeta de crédito robada? ¿Qué estrategias se usan en cada caso para proteger el sistema? Images: free for commercial use: - https://pixabay.com/photos/money-cards-business-credit-card-256319/ - https://pixabay.com/photos/lock-combination-security-safety-1929089/

Por supuesto, el atacante puede intentar usar una llave maestra, o robar el PIN con ingeniería social. Ese tipo de ataques o bien es "romper un algoritmo" o bien "usar canales laterales". No vamos a considerarlos por ahora, vamos a considerar que los sistemas se usan cómo se han diseñado

Fíjate en estos casos: - a mismo número de caracteres, mayores posibilidades (números...) aumenta el tamaño en bits - a mismo número de posibilidades, aumentar el número de caracter aumenta el tamaño en bits - una contraseña de 54 letras mayúsculas tiene el mismo número de bits que una contraseña de letras minúsculas, mayúscuas, números y caracteres especiales: misma seguridad

Estos cálculos están desactualizados y son más rápidos cada año. En cualquier caso sirven para hacernos una idea de lo rápido que pueden hacer fuerza bruta los ordenadores actuales

No recuerdo qué cifré aquí, ni con que clave, pero no parece difícil descubrirlo. - Hay letras solas, que en castellano solo pueden ser a, y, o. También e, u, pero es muy improbable. Cualquier otra letra será aún más improbable. Por eso la criptografía clásica en realidad nunca ha usado espacios: da mucha información al adversario - Haciendo análisis de frecuencias, la h aparece muchas veces: es muy probable que sea a ó e - Los dígrafos hv gh (varias veces...) podrían ser es, el, me, le ó se **La información de contexto nos ayuda a descifrar (espacios, lenguaje...)**. Eso también pasa en una web actual: ¿qué es lo que tiene un mensaje cifrado a un banco inmediatamente después de visitar una tienda?

## Transponer y sustituir Podemos añadir una transposición a la vez de una substitución: ![center](images/historia/marshrut.png) Podemos mapear cualquier letra a cualquier otra letra ``` ABCDEFGHIJKLMNOPQRSTUVWXYZ XZCTEROSIULKWNGYQFHDJVMAPB ``` Todo esto aumenta el espacio de claves, pero sigue siendo vulnerable a análisis de frecuencia. <!-- En vez de usar un movimiento en el alfabeto, podemos cambiar totalmente el alfabeto. Eso aumenta espectacularmente el espacio de claves, hasta el punto de que no es posible para un humano hacer fuerza bruta... ... pero no impide hacer análisis frecuencial. Cualquiera de estas propuestas está tan rota como el cifrado César. Imagen: https://i1.wp.com/nozdr.ru/_media/games/quest/for/cipher/marshrut.png

La primetra letra del mensaje se cifra con la primera columna, la segunda con la segunda... y así. ¡El texto ya no es analizable por frecuencias! Pero no comple la máxima de Shanon: el sistema es seguro solo mientras que la table se mantenga en secreto. La tabula recta abrió el camino de los cifrados polialfabéticos. Solo unos 20 años después, Battista Bellaso añadió una clave al sistema

Fíjate: el "tabula recta" es un Vigenère con una clave fija que se se puede cambiar $k=ABCD...WXYZ$

Images: https://people.duke.edu/~ng46/collections/crypto-disk-us-ww1-front.jp

clave: SESAME Ahora el análisis frecuencil es mucho más complejo... ¡pero podemos agrupar los textos en grupos de 6 y aplicar frecuencias a cada columna! ¿Por qué 6? No lo sabemos. Podemos probar, o buscar ciclos (que son comunes) y estimar la longitud de la clabe. En ejemplo, la w está muchas veces en grupos de palabras solos: ¿quizá es la E cifrada con una de esas S de la clave?

Entreguerras, guerra civil española, ejército alemán. En la guerra civil española, el bando sublevado utilizaba la versión comercial (que los ingleses sabían leer) Fijate: - Los rotores podían extraerse e intercambiar sus posiciones - Los rotores podían empezar en cualquier letra - El panel conectaba (o no) pares de letra entre sí. Al principio tenía 4 cables, luego aumentó a 6. El panel era exclusivo de la versión militar. La clave era: posición de los rotores, letras iniciales en los rotores, posición de los cables. Todo esto cambiaba cada día. Además, para evitar que todos los alemanes usasen cada día la misma clave en todos sus mensajes, había al inicio un pequeño paso adicional de anuncio de "clave de sesión".

https://upload.wikimedia.org/wikipedia/commons/thumb/b/bd/Enigma_%28crittografia%29_-_Museo_scienza_e_tecnologia_Milano.jpg/800px-Enigma_%28crittografia%29_-_Museo_scienza_e_tecnologia_Milano.jpg https://res.cloudinary.com/practicaldev/image/fetch/s--2qwhwBZd--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://raw.githubusercontent.com/maxime1992/my-dev.to/master/blog-posts/enigma-part-1/assets/enigma-schema.jpg El ejemplo de la derecha solo muestra la versión comercial sin el panel frontal de cables. Los aliados tenían copias de la versión comercial pero no la versión militar. No sabían, entre otros detalles, cómo estaban cableados los rotores por dentro. Además, la versión militar tenía 5 rotores disponibles, de los que cada día se usaban tres.

En la película, se dice que "hitler" es la palabra que siempre que se repetía. En realidad, "nada que reportar" e "informe metereológico" eran las frases más habituales, y las que se utilizaron para romper el cifrado

Fíjate: - La máquina Enigma para cifrado y descifrado era sencilla y transportable - Las Bombe eran máquinas enormes que ocupaban salas enteras Esta diferencia seguimos viéndola en la criptografía actual: necesitamos poder cifrar fácilmente con pequeños dispositivos muy baratos, pero las máquinas que rompen los cifrados son mucho más grandes, caras y complejas

excepto la longitud... y el momento de enviarlo, ...y el número de mensajes La fotogradía no es la máquina patentada por Vernam, sino la máquina de Lorenz, usada en la Segunda Guerra mundial por los alemanes para mensajes que necesitaban permanecer secretos mucho tiempo (comunicaciones dipomáticas, por ejemplo). La máquina de Lorentz era similar a la de Vernam

Desde que los matemáticos entraron en la criptografía, existe definiciones de todos los términos tan exactas y formales como incomprensibles para un profano Cosas que implica: - Lo que dijimos antes: dado un texto cifrado, no conocemos nada de su texto en claro - Dado un texto cifrado, el mensaje en claro podría ser cualquiera:

Historia de la criptografía

Hoy hablamos de...

Cosas que no son criptografía

El lenguaje de los petisos carambanales

Textos Aljamiados

Manuscrito Voynich

Criptografía clásica

Criptografía = cifrado

Mecanismos clásicos de cifrado

Transposición: escítala griega

Sustitución: cifrado César

Criptografía moderna

Cifrado César

Historia

Cifrado

Descifrado

Atacando el cifrado César

Descifrar un texto probando todas las claves posibles

Contramedidas

Tamaños de clave

Fuerza bruta

Fortaleza de un algoritmo

Aumentando el espacio de claves en César: mapeo aleatorio

¿Cuánto tiempo necesitamos guardar un secreto?

Mejorando la fuerza bruta

Análisis de frecuencias

Rotura de algoritmos criptográficos

Mejoras al cifrado César: sistemas polialfabéticos

Tabula recta

Cifrado de Vigenère

Ejemplo

Seguridad de Vigenére

Máquina Enigma

Máquina Enigma: seguridad

Confidencialidad perfecta

Confidencialidad perfecta

¿A qué hora atacamos?

Condiciones de la confidencialidad perfecta

Convirtiendo Vigènere en cifrado perfecto: cifrado Vernam (one time pad)

Vulnerabilidades

Resumen y referencias

1976, el año que empezó todo...

Referencias

¡Gracias!