Quizás piense a primera vista “¿Qué quiere decir esta pregunta? Lo que es un correo electrónico está claro!”. Lo que desde la perspectiva típica del usuario inicialmente ciertamente es fácil, correcto y comprensible de responder, puede bajo aspectos más técnicos (y también de cumplimiento) convertirse en una pregunta delicada. Especialmente cuando se trata del archivado de correos electrónicos y la cuestión del original de un correo electrónico. La administración fiscal revisa el archivado de correos del contribuyente, entre otras cosas, basándose en los criterios de ordenación de la GoBD, según los cuales la restauración del original de cada correo archivado debe ser posible.

Por supuesto, Benno MailArchiv cuenta desde el primer momento con la posibilidad de mostrar cada correo archivado en su original. En este proceso, el correo electrónico archivado en formato nativo RFC 822 se extrae del archivo, se desempaqueta y se muestra como “código fuente”. No es nada especial, ni responde a nuestra pregunta inicial. Finalmente, se archiva lo que proviene del servidor de correo o del buzón del usuario y que debe archivarse.

Originales y ejemplares de correo

¿Qué ocurre, si en lugar de un único original relevante de un correo electrónico hay dos, tres o incluso más ejemplares? Sin embargo, aquí hablamos enfatizadamente no de duplicados simples, como por ejemplo correos electrónicos recuperados varias veces de un buzón o similar. Detectar duplicados de correo (o dobletes) es una de las tareas más elementales de una solución de archivado de correos. Benno MailArchiv domina esto tanto como la visualización de correos en su original.

“¿Varios originales relevantes de un mismo correo electrónico? ¡Imposible!” dice usted? No en entornos complejos, como los que aparecen a veces en la práctica en grandes empresas de hosting y proveedores de servicios en la nube (CSP). Aquí los correos electrónicos llegan, debido a circunstancias relacionadas con la infraestructura, a veces varias veces al “embudo de procesamiento” de Benno MailArchiv.

Los hechos descritos a continuación son relativamente fáciles de comprender desde el punto de vista técnico. Pero la archivación de correo electrónico conforme a la ley es mucho más que la representación o implementación técnica de los requisitos (GoBD y de cumplimiento). Es una IT-Lösung en el campo de tensión de las preocupaciones de los usuarios, los requisitos legales y, en su caso, los requisitos generales de cumplimiento.

Le invitamos a discutir con nosotros qué es un correo electrónico (o quizá no lo sea). Es posible que su percepción sobre algo tan trivial como “Ding” cambie al leer este artículo. Envíenos un correo electrónico o utilice la función de comentarios al final de esta publicación para compartir su opinión.

Archivar correos electrónicos es, desde un punto de vista técnico, una tarea relativamente sencilla. Hay (en términos generales) buzones de usuario, servidores de correo y rutas de transporte. Todo está equipado con interfaces correspondientes. A partir de las circunstancias locales respectivas, a menudo surgen varias posibilidades para archivar correos electrónicos (de manera adecuada a los requisitos pertinentes).

Archivado de correo en las instalaciones o en la propia casa

Una archivación de correo configurada en las instalaciones es a menudo caracterizada por el hecho de que todos los correos electrónicos que se van a archivar siempre y sin excepción se archivan a través de la misma ruta o del mismo mecanismo elegido. Aunque la entrega de correo electrónico al archivo puede ser individual según el cliente y su entorno de TI, se puede establecer que la ruta de todos los correos electrónicos en instalaciones locales (una vez que se ha establecido y configurado) es de facto siempre la misma. Una vez que se ha completado la conexión al archivo de correo, todo lo demás funciona prácticamente por sí solo. Todos los correos electrónicos que se van a archivar siempre toman la misma ruta. Una talla vale para todos.

La ventaja de esta situación es la uniformidad. La entrega de correo al archivo se realiza según un esquema bien definido. Por lo general, no hay excepciones. Por lo tanto, los correos electrónicos duplicados están ampliamente excluidos. El resto, es decir, la clasificación de posibles duplicados reales, lo realiza la detección de duplicados de Benno MailArchiv en el momento de la archivación.

Archivado de correo en la nube

Sin embargo, una imagen completamente diferente se muestra con frecuencia en entornos grandes y complejos. Por ejemplo, especialmente en las infraestructuras de proveedores de hosting y cloud más grandes. Debido a una variedad de circunstancias posibles (diferentes rutas de transporte de correo, diferentes servidores de transporte de correo (MTA) y diferentes estrategias de alimentación al archivo (activo por SMTP o pasivo por IMAP o POP3, etc.)), sucede aquí una y otra vez que el mismo correo electrónico se transporta varias veces al archivo a través de diferentes caminos y, por lo tanto, está pendiente de archivarse varias veces.

Especialmente las diferentes rutas de transporte de correo y los MTAs hacen que los correos electrónicos transportados se proporcionen con encabezados de transporte específicos de la ruta según la ruta de transporte atravesada. Si un correo electrónico concreto llega varias veces al archivo a través de diferentes rutas y se proporciona con diferentes encabezados (lo que es inevitable con diferentes MTAs), se entregan diferentes correos electrónicos para su archivo desde la perspectiva de la detección de duplicados.

Echemos un vistazo más de cerca a esto con la ayuda de un ejemplo:

En una infraestructura compleja, un correo electrónico concreto "M" se transfiere a Benno MailArchiv para su archivo a través de tres vías diferentes. Durante el transporte de cada uno de los tres ejemplares de este correo electrónico (M1, M2, M3) a través de vías diferentes, se registran encabezados diferentes para cada ejemplar de correo electrónico. Los ejemplares de correo electrónico son idénticos en contenido, es decir, desde el punto de vista del usuario, son idénticos. Sin embargo, se diferencian formalmente y técnicamente entre sí debido a los diferentes encabezados.

Los encabezados marcan la diferencia

Desde el punto de vista de la detección de duplicados o duplicados de Benno MailArchiv, se trata de tres correos electrónicos diferentes sin duda. Al archivar, se genera una suma de comprobación SHA256 para cada correo electrónico entregado. Debido a los diferentes encabezados (de los ejemplares de correo por lo demás idénticos), se obtienen tres sumas de comprobación diferentes "C1", "C2" y "C3" para los diferentes ejemplares. Por lo tanto, los tres ejemplares del mismo correo electrónico son considerados como correos electrónicos diferentes desde el punto de vista de Benno MailArchiv. Por lo tanto, también se archivarían individualmente como tales. Esto a su vez tendría la consecuencia de que desde el punto de vista del usuario (es decir, en relación con el contenido puramente informativo del correo electrónico) parecería que hay tres correos electrónicos idénticos en el archivo. Al buscar en el contenido del mensaje, se encontrarían y mostrarían los tres ejemplares de correo electrónico.

En un entorno de este tipo, la detección de duplicados convencional no tiene sentido. ¿Quién quiere encontrar varias correos electrónicos (según el contenido del mensaje) iguales al buscar? ¿Y cómo se puede lograr que solo se archive uno de los tres ejemplares de correo electrónico?

La complejidad requiere soluciones sencillas

Como se sabe, la complejidad se compensa mejor con la simplicidad interna y las soluciones sencillas que con construcciones de soluciones complejas.

Si profundizamos un poco más en el asunto, nos damos cuenta de que un correo electrónico ya es identificable de forma única mediante los siguientes encabezados y, además, mediante su texto del mensaje:

  • Remitente del sobre – X-REAL-MAILFROM
  • Destinatario del sobre – X-REAL-RCPTTO
  • Ruta de retorno
  • Asunto
  • Identificador del mensaje
  • Fecha
  • De
  • Para
  • Copia
  • Cuerpo

Naturalmente, se producen otros encabezados específicos (llamados Received-Header) en el correo electrónico, especialmente durante el transporte por SMTP. Los contenidos de estos Received-Header dependen del camino de transporte real del correo electrónico respectivo. Esto significa que si dos correos electrónicos M1 y M2 son idénticos en relación con los encabezados mencionados anteriormente (no específicos del transporte), se trata definitivamente del mismo correo electrónico – independientemente de qué y cuántos encabezados relacionados con el transporte todavía están contenidos en el correo electrónico.

Conclusión: El camino de transporte puede causar encabezados adicionales. Por lo tanto, un correo electrónico se convierte en un correo electrónico con varias copias no idénticas. Los encabezados relacionados con el transporte no son importantes para la unicidad del contenido o mensaje del correo electrónico (su presencia solo documenta el camino de transporte recorrido).

Además, no solo los encabezados Received, también las firmas DKIM (y otros elementos) no están directamente relacionados con el contenido del correo electrónico. Se puede asignar estos encabezados al sobre de un correo electrónico.

Por lo tanto, la solución para la situación con varios ejemplares de correo electrónico, que son técnicamente diferentes pero idénticos en contenido, está cerca: mientras que por razones de cumplimiento, la suma de comprobación sobre todo el correo electrónico es obligatoria, una segunda suma de comprobación que se basa exclusivamente en las partes del correo electrónico mencionadas anteriormente resuelve el dilema de manera simple y efectiva.

Práctica frente a criterios formales y cumplimiento

Algunos temas pueden resolverse de manera elegante por medios técnicos. Sin embargo, algunas soluciones prácticas fallan en la práctica debido a aspectos formales. Así que también es apropiado aquí echar un vistazo más de cerca, ya que el cumplimiento, lamentablemente, tiene prioridad sobre la practicidad en lo que respecta al archivo de correo electrónico:

La archivación de correo electrónico conforme a GoBD requiere la posibilidad de poder restaurar cada correo electrónico en su estado original desde el archivo. Cada correo electrónico debe, por lo tanto, incl. todos los encabezados, adjuntos, etc., es decir, prácticamente en el “texto fuente del mensaje”, poder mostrarse. Además, cada correo electrónico debe ser verificable respecto a posibles manipulaciones. Concretamente, mediante la suma de verificación mencionada anteriormente sobre todo el correo electrónico, se puede comprobar la consistencia o integridad de un correo electrónico archivado así como del contenido total del archivo.

Volviendo a nuestro ejemplo: si ahora se envían varias E-Mails M1, M2 y M3 (en el sentido mencionado anteriormente, ejemplares diferentes de la misma E-Mail) con el mismo texto o contenido para su archivo, surge la pregunta de cómo proceder con los ejemplares de correo que difieren en cuanto a sus encabezados.

Una visión de los aspectos legales de esta situación

Suponemos que, legalmente hablando, no existe ninguna obligación de archivar varias versiones de un correo electrónico, especialmente si solo se diferencian entre sí en lo que respecta a los encabezados de correo incluidos. Sin embargo, dado que no se puede descartar que diferentes círculos defiendan diferentes interpretaciones legales, es posible que nuestra suposición no sea universalmente aceptada o que sea legalmente incorrecta.

Para evitar un posible dilema (legal), por lo tanto, (considerado de manera pragmática) se deben archivar todos los ejemplares del correo electrónico en cuestión (en nuestro ejemplo M1, M2, M3).

Si se considera la situación de manera puramente formal, se trata de diferentes correos electrónicos en el sentido de nuestro ejemplo. Incluso si las diferencias entre ellos son de naturaleza técnica y el valor práctico de las diferencias entre ellos en la vida cotidiana no existe o es apenas perceptible, formalmente se trata de diferentes correos electrónicos. Esto se puede verificar inmediatamente sobre la base de las sumas de comprobación diferentes.

Por otro lado, cualquier incertidumbre jurídica puede excluirse simplemente archivando todos los ejemplares de correo electrónico. Incluso si técnicamente sería fácil de implementar utilizando el procedimiento descrito anteriormente con dos sumas de comprobación diferentes por correo electrónico, por ejemplo, archivar solo el primer ejemplar de una serie de ejemplares de correo electrónico

Para lograr una solución legalmente segura para el operador, recomendamos discutir este asunto con un asesor legal de su elección antes de la implementación. Solo después de que se haya discutido y decidido la forma concreta de implementar la detección de duplicados, se deberá realizar la implementación correspondiente.

Hasta nuevo aviso consideramos que legalmente podría ser suficiente podría, aplicar la detección simplificada de duplicados, es decir, archivar solo uno de los múltiples ejemplares de correo electrónico que llegan. Debido a los requisitos de la GoBD, la creación de una documentación de procesos es obligatoria sin ninguna duda. En este contexto consideramos que la Erklärung o el registro del hecho, de que solo se archiva un ejemplar de correo, en la documentación de procesos sería suficiente dürfte, para lograr una archivación legalmente segura.

La decisión sobre el tipo de detección de duplicados aplicada y la responsabilidad correspondiente frente a la administración financiera recae únicamente al operador.

¿Qué es un correo electrónico?

¿Es un correo electrónico cada ejemplar, incluso si dos ejemplares solo se diferencian por un único encabezado de transporte que, a su vez, no contribuye a aumentar el valor informativo del mensaje? ¿Se clasifica un correo electrónico de esta manera solo según los criterios formales? ¿O es un correo electrónico un mensaje entre dos o más usuarios, cuya parte esencial (y también relevante para el archivo conforme a GoBD) es el mensaje real? ¿Son los encabezados de correo (que generalmente permanecen ocultos para el usuario) también en relación con la GoBD no tan importantes (incluso si se archivan como parte del correo original)?

Lo que un correo electrónico es exactamente sigue siendo, en este sentido, probablemente todavía abierto durante algún tiempo.

Ahora tiene usted, querido lector, la palabra. ¡Envíenos un correo electrónico o un comentario sobre su opinión sobre el tipo y el alcance de un correo electrónico!.

Nota legal / Exclusión de responsabilidad / Descargo de responsabilidad

Esta contribución no constituye asesoramiento legal. Solo sirve para información general. No asumimos ninguna garantía por la exactitud o integridad de la información. Se excluye cualquier responsabilidad.