¿Qué es exactamente un correo electrónico?
Quizás piense a primera vista "¿Qué es esta pregunta? ¡Qué es un correo electrónico está muy claro!". Lo que desde una perspectiva típica del usuario inicialmente parece simple, correcto y comprensible de responder, puede convertirse en una cuestión delicada bajo consideraciones más técnicas (y también de cumplimiento). Especialmente cuando se trata del archivo de correos electrónicos y la cuestión del original de un correo electrónico. La administración financiera examina el archivo de correo del contribuyente, entre otras cosas, sobre la base de los criterios de corrección de la GoBD, según la cual debe ser posible restaurar el original de cada correo electrónico archivado.
Por supuesto, Benno MailArchiv ha tenido la capacidad de mostrar cada correo electrónico archivado en su forma original desde el primer momento. Para ello, se recupera del archivo el correo electrónico archivado en formato nativo RFC 822, se descomprime y se muestra como "código fuente". Esto no es nada especial y no explica nuestra pregunta inicial. Después de todo, se archiva lo que proviene del servidor de correo o de la bandeja de correo del usuario y debe ser archivado.
Originales y ejemplares de correo
¿Pero qué sucede si en lugar de un único original relevante de un correo electrónico hay dos, tres o incluso más ejemplares? Sin embargo, aquí no nos referimos a duplicados simples
¿“Múltiples originales relevantes de un mismo correo electrónico? ¡Imposible!“ ¿dicen ustedes? No en entornos complejos, como los que surgen una y otra vez en la práctica en grandes empresas de hosting y proveedores de servicios en la nube (CSP). Aquí, los correos electrónicos llegan varias veces al “embudo de procesamiento“ de Benno MailArchiv debido a circunstancias relacionadas con la infraestructura.
Los hechos descritos a continuación son relativamente fáciles de entender desde un punto de vista técnico. Sin embargo, el archivo de correo electrónico conforme a la ley es mucho más que la representación técnica o la implementación de los requisitos (GoBD y cumplimiento). Es una solución de TI en el campo de tensión de los intereses de los usuarios, los requisitos legales y posiblemente los requisitos generales de cumplimiento.
Le invitamos a discutir con nosotros qué es un correo electrónico (o quizás no lo sea). Posiblemente su imagen sobre algo tan trivial como los correos electrónicos cambiará después de leer este artículo. Envíenos un correo electrónico o utilice la función de comentarios al final de esta contribución para hacernos saber su opinión al respecto.
Archivar correos electrónicos es, desde un punto de vista técnico, una tarea relativamente sencilla. Hay (en términos generales) buzones de usuario, servidores de correo y rutas de transporte. Todo está equipado con interfaces correspondientes. A partir de las circunstancias locales respectivas, a menudo surgen varias posibilidades para archivar correos electrónicos (de manera adecuada a los requisitos pertinentes).
Archivado de correo en las instalaciones o en la propia casa
Una archivación de correo configurada en las instalaciones es a menudo caracterizada por el hecho de que todos los correos electrónicos que se van a archivar siempre y sin excepción se archivan a través de la misma ruta o del mismo mecanismo elegido. Aunque la entrega de correo electrónico al archivo puede ser individual según el cliente y su entorno de TI, se puede establecer que la ruta de todos los correos electrónicos en instalaciones locales (una vez que se ha establecido y configurado) es de facto siempre la misma. Una vez que se ha completado la conexión al archivo de correo, todo lo demás funciona prácticamente por sí solo. Todos los correos electrónicos que se van a archivar siempre toman la misma ruta. Una talla vale para todos.
La ventaja de esta situación es la uniformidad. La entrega de correo al archivo se realiza según un esquema bien definido. Por lo general, no hay excepciones. Por lo tanto, los correos electrónicos duplicados están ampliamente excluidos. El resto, es decir, la clasificación de posibles duplicados reales, lo realiza la detección de duplicados de Benno MailArchiv en el momento de la archivación.
Archivado de correo en la nube
Sin embargo, una imagen completamente diferente se muestra con frecuencia en entornos grandes y complejos. Por ejemplo, especialmente en las infraestructuras de proveedores de hosting y cloud más grandes. Debido a una variedad de circunstancias posibles (diferentes rutas de transporte de correo, diferentes servidores de transporte de correo (MTA) y diferentes estrategias de alimentación al archivo (activo por SMTP o pasivo por IMAP o POP3, etc.)), sucede aquí una y otra vez que el mismo correo electrónico se transporta varias veces al archivo a través de diferentes caminos y, por lo tanto, está pendiente de archivarse varias veces.
Especialmente las diferentes rutas de transporte de correo y los MTAs hacen que los correos electrónicos transportados se proporcionen con encabezados de transporte específicos de la ruta según la ruta de transporte atravesada. Si un correo electrónico concreto llega varias veces al archivo a través de diferentes rutas y se proporciona con diferentes encabezados (lo que es inevitable con diferentes MTAs), se entregan diferentes correos electrónicos para su archivo desde la perspectiva de la detección de duplicados.
Echemos un vistazo más de cerca a esto con la ayuda de un ejemplo:
En una infraestructura compleja, un correo electrónico concreto "M" se transfiere a Benno MailArchiv para su archivo a través de tres vías diferentes. Durante el transporte de cada uno de los tres ejemplares de este correo electrónico (M1, M2, M3) a través de vías diferentes, se registran encabezados diferentes para cada ejemplar de correo electrónico. Los ejemplares de correo electrónico son idénticos en contenido, es decir, desde el punto de vista del usuario, son idénticos. Sin embargo, se diferencian formalmente y técnicamente entre sí debido a los diferentes encabezados.
Los encabezados marcan la diferencia
Desde el punto de vista de la detección de duplicados o duplicados de Benno MailArchiv, se trata de tres correos electrónicos diferentes sin duda. Al archivar, se genera una suma de comprobación SHA256 para cada correo electrónico entregado. Debido a los diferentes encabezados (de los ejemplares de correo por lo demás idénticos), se obtienen tres sumas de comprobación diferentes "C1", "C2" y "C3" para los diferentes ejemplares. Por lo tanto, los tres ejemplares del mismo correo electrónico son considerados como correos electrónicos diferentes desde el punto de vista de Benno MailArchiv. Por lo tanto, también se archivarían individualmente como tales. Esto a su vez tendría la consecuencia de que desde el punto de vista del usuario (es decir, en relación con el contenido puramente informativo del correo electrónico) parecería que hay tres correos electrónicos idénticos en el archivo. Al buscar en el contenido del mensaje, se encontrarían y mostrarían los tres ejemplares de correo electrónico.
En un entorno de este tipo, la detección de duplicados convencional no tiene sentido. ¿Quién quiere encontrar varias correos electrónicos (según el contenido del mensaje) iguales al buscar? ¿Y cómo se puede lograr que solo se archive uno de los tres ejemplares de correo electrónico?
La complejidad requiere soluciones sencillas
Como se sabe, la complejidad se compensa mejor con la simplicidad interna y las soluciones sencillas que con construcciones de soluciones complejas.
Si profundizamos un poco más en el asunto, nos damos cuenta de que un correo electrónico ya es identificable de forma única mediante los siguientes encabezados y, además, mediante su texto del mensaje:
- Remitente del sobre – X-REAL-MAILFROM
- Destinatario del sobre – X-REAL-RCPTTO
- Ruta de retorno
- Asunto
- Identificador del mensaje
- Fecha
- De
- Para
- Copia
- Cuerpo
Naturalmente, se producen otros encabezados específicos (llamados Received-Header) en el correo electrónico, especialmente durante el transporte por SMTP. Los contenidos de estos Received-Header dependen del camino de transporte real del correo electrónico respectivo. Esto significa que si dos correos electrónicos M1 y M2 son idénticos en relación con los encabezados mencionados anteriormente (no específicos del transporte), se trata definitivamente del mismo correo electrónico – independientemente de qué y cuántos encabezados relacionados con el transporte todavía están contenidos en el correo electrónico.
Conclusión: El camino de transporte puede causar encabezados adicionales. Por lo tanto, un correo electrónico se convierte en un correo electrónico con varias copias no idénticas. Los encabezados relacionados con el transporte no son importantes para la unicidad del contenido o mensaje del correo electrónico (su presencia solo documenta el camino de transporte recorrido).
Además, no solo los encabezados Received, también las firmas DKIM (y otros elementos) no están directamente relacionados con el contenido del correo electrónico. Se puede asignar estos encabezados al sobre de un correo electrónico.
Por lo tanto, la solución para la situación con varios ejemplares de correo electrónico, que son técnicamente diferentes pero idénticos en contenido, está cerca: mientras que por razones de cumplimiento, la suma de comprobación sobre todo el correo electrónico es obligatoria, una segunda suma de comprobación que se basa exclusivamente en las partes del correo electrónico mencionadas anteriormente resuelve el dilema de manera simple y efectiva.
Práctica frente a criterios formales y cumplimiento
Algunos temas pueden resolverse de manera elegante por medios técnicos. Sin embargo, algunas soluciones prácticas fallan en la práctica debido a aspectos formales. Así que también es apropiado aquí echar un vistazo más de cerca, ya que el cumplimiento, lamentablemente, tiene prioridad sobre la practicidad en lo que respecta al archivo de correo electrónico:
El archivo de correo conforme a GoBD requiere la posibilidad de restaurar cada correo electrónico a su estado original desde el archivo. Por lo tanto, cada correo electrónico debe poder mostrarse con todos los encabezados, archivos adjuntos, etc., es decir, prácticamente en el "texto fuente del mensaje". Además, cada correo electrónico debe ser verificable en cuanto a posibles manipulaciones. Concretamente, se puede verificar la consistencia o integridad de un correo electrónico archivado y de todo el contenido del archivo mediante la suma de comprobación mencionada anteriormente sobre todo el correo electrónico.
Volviendo a nuestro ejemplo: si ahora se envían varias E-Mails M1, M2 y M3 (en el sentido mencionado anteriormente, ejemplares diferentes de la misma E-Mail) con el mismo texto o contenido para su archivo, surge la pregunta de cómo proceder con los ejemplares de correo que difieren en cuanto a sus encabezados.
Una visión de los aspectos legales de esta situación
Suponemos que, legalmente hablando, no existe ninguna obligación de archivar varias versiones de un correo electrónico, especialmente si solo se diferencian entre sí en lo que respecta a los encabezados de correo incluidos. Sin embargo, dado que no se puede descartar que diferentes círculos defiendan diferentes interpretaciones legales, es posible que nuestra suposición no sea universalmente aceptada o que sea legalmente incorrecta.
Para evitar un posible dilema (legal), por lo tanto, (considerado de manera pragmática) se deben archivar todos los ejemplares del correo electrónico en cuestión (en nuestro ejemplo M1, M2, M3).
Si se considera la situación de manera puramente formal, se trata de diferentes correos electrónicos en el sentido de nuestro ejemplo. Incluso si las diferencias entre ellos son de naturaleza técnica y el valor práctico de las diferencias entre ellos en la vida cotidiana no existe o es apenas perceptible, formalmente se trata de diferentes correos electrónicos. Esto se puede verificar inmediatamente sobre la base de las sumas de comprobación diferentes.
Por otro lado, cualquier incertidumbre jurídica puede excluirse simplemente archivando todos los ejemplares de correo electrónico. Incluso si técnicamente sería fácil de implementar utilizando el procedimiento descrito anteriormente con dos sumas de comprobación diferentes por correo electrónico, por ejemplo, archivar solo el primer ejemplar de una serie de ejemplares de correo electrónico
Para lograr una solución legalmente segura para el operador, recomendamos discutir este asunto con un asesor legal de su elección antes de la implementación. Solo después de que se haya discutido y decidido la forma concreta de implementar la detección de duplicados, se deberá realizar la implementación correspondiente.
Hasta nuevo aviso, asumimos que podría ser legalmente suficiente aplicar la detección simplificada de duplicados, es decir, archivar solo uno de varios ejemplares de correo electrónico recibidos. Debido a los requisitos de GoBD, la creación de una documentación de procedimiento es obligatoria y no está en cuestión. En este contexto, asumimos que la explicación o registro del hecho de que solo se archiva un ejemplar de correo electrónico sería suficiente para lograr un archivo legalmente seguro.
La decisión sobre el tipo de detección de duplicados utilizada y, por lo tanto, la responsabilidad frente a la administración financiera recae única y exclusivamente en el operador.
¿Qué es un correo electrónico?
¿Es un correo electrónico cada ejemplar, incluso si dos ejemplares solo se diferencian por un único encabezado de transporte que, a su vez, no contribuye a aumentar el valor informativo del mensaje? ¿Se clasifica un correo electrónico de esta manera solo según los criterios formales? ¿O es un correo electrónico un mensaje entre dos o más usuarios, cuya parte esencial (y también relevante para el archivo conforme a GoBD) es el mensaje real? ¿Son los encabezados de correo (que generalmente permanecen ocultos para el usuario) también en relación con la GoBD no tan importantes (incluso si se archivan como parte del correo original)?
Lo que un correo electrónico es exactamente sigue siendo, en este sentido, probablemente todavía abierto durante algún tiempo.
Ahora tiene usted, querido lector, la palabra. ¡Envíenos un correo electrónico o un comentario sobre su opinión sobre el tipo y el alcance de un correo electrónico!.
Nota legal / Exclusión de responsabilidad / Descargo de responsabilidad
Esta contribución no constituye asesoramiento legal. Solo sirve para información general. No asumimos ninguna garantía por la exactitud o integridad de la información. Se excluye cualquier responsabilidad.