{"id":1781,"date":"2024-06-03T18:53:01","date_gmt":"2024-06-03T16:53:01","guid":{"rendered":"https:\/\/ittester.sk\/sin-categorizar\/etl-pruebas-preguntas-para-hablar\/"},"modified":"2024-07-11T09:43:50","modified_gmt":"2024-07-11T07:43:50","slug":"etl-pruebas-preguntas-para-hablar","status":"publish","type":"post","link":"https:\/\/ittester.sk\/es\/preguntas-de-la-entrevista\/etl-pruebas-preguntas-para-hablar\/","title":{"rendered":"28 preguntas y respuestas de entrevistas para pruebas ETL"},"content":{"rendered":"\n<p>Las pruebas ETL se utilizan para verificar la correcci\u00f3n de la migraci\u00f3n de datos de la base de datos de origen a la base de datos de destino, junto con la verificaci\u00f3n de las reglas de transformaci\u00f3n.<\/p>\n\n<p>En este art\u00edculo, hemos recopilado una lista de algunas preguntas frecuentes de las entrevistas de pruebas ETL.  <\/p>\n\n<h2 class=\"wp-block-heading\">Preguntas y respuestas de la entrevista sobre pruebas ETL<\/h2>\n\n<p><strong>Pregunta.1. \u00bfQu\u00e9 es ETL?<\/strong><\/p>\n\n<p>R: La abreviatura ETL significa Extraer, Transformar y Cargar. Estas tres funciones son funciones de base de datos y se realizan sobre los datos para pasarlos de una o varias fuentes (base de datos) a otra (base de datos).<\/p>\n\n<p><strong>Pregunta.2. \u00bfQu\u00e9 es el proceso ETL?<\/strong><\/p>\n\n<p>R: El proceso ETL consta de tres pasos:<\/p>\n\n<ul class=\"wp-block-list\">\n<li><strong>Extracci\u00f3n<\/strong> &#8211; En este paso, se extraen los datos de una o varias bases de datos fuente.<\/li>\n\n\n\n<li><strong>Transformaci\u00f3n<\/strong> &#8211; En este segundo paso, los datos se transforman en un formato adecuado para la base de datos de destino.<\/li>\n\n\n\n<li><strong>Carga<\/strong> &#8211; los datos transformados se cargan finalmente en la base de datos de destino.<\/li>\n<\/ul>\n\n<p><strong>Pregunta.3. \u00bfQu\u00e9 es la prueba ETL? \u00bfO cu\u00e1l es la importancia de las pruebas ETL?<\/strong><\/p>\n\n<p>Respuesta: Las pruebas ETL se realizan para garantizar la exactitud de los datos que se cargan en la base de datos de destino. Tambi\u00e9n garantiza que se siguen las reglas de transformaci\u00f3n de datos requeridas y que no se pierden datos durante el proceso ETL.  <\/p>\n\n<p><strong>Pregunta. 4. \u00bfCu\u00e1les son los distintos retos de las pruebas ETL?<\/strong><\/p>\n\n<p>R: Los distintos retos de las pruebas ETL son:<\/p>\n\n<ul class=\"wp-block-list\">\n<li>Indisponibilidad de datos de prueba, ya que las pruebas ETL requieren grandes cantidades de datos de prueba.  <\/li>\n\n\n\n<li>Falta de recursos cualificados, ya que las pruebas ETL requieren consultas SQL complejas.<\/li>\n\n\n\n<li>Dise\u00f1ar casos de prueba es dif\u00edcil porque las pruebas ETL requieren trabajar con grandes vol\u00famenes de datos.<\/li>\n\n\n\n<li>Los datos de prueba disponibles pueden no cubrir todos los escenarios posibles.<\/li>\n\n\n\n<li>P\u00e9rdida de datos durante las pruebas ETL.<\/li>\n<\/ul>\n\n<p><strong>Pregunta.5. \u00bfCu\u00e1les son los cuatro tipos de pruebas ETL? Explica brevemente cada una de ellas.<\/strong><\/p>\n\n<p>Contesta: Esta es una de las preguntas m\u00e1s frecuentes en una entrevista de pruebas ETL.  <\/p>\n\n<ul class=\"wp-block-list\">\n<li>Pruebas de nuevo almac\u00e9n de datos &#8211; En este tipo de pruebas, se crea un nuevo almac\u00e9n de datos desde cero. Los datos de entrada se obtienen del cliente.<\/li>\n\n\n\n<li>Pruebas de migraci\u00f3n &#8211; Este tipo de pruebas son necesarias cuando se migran datos de una base de datos antigua a una nueva.<\/li>\n\n\n\n<li>Solicitud de cambio &#8211; En este tipo de pruebas, los datos se recuperan de varias fuentes y se cargan en una base de datos existente.<\/li>\n\n\n\n<li>Pruebas de informes &#8211; Las pruebas de informes comprueban la exactitud de los datos, los derechos de acceso y el dise\u00f1o de los informes creados en el sistema de almac\u00e9n de datos.<\/li>\n<\/ul>\n\n<p><strong>Pregunta.6. \u00bfQu\u00e9 es el Esquema Estrella?<\/strong><\/p>\n\n<p>R: Un esquema en estrella es un esquema multidimensional utilizado para modelar sistemas de almacenamiento de datos. Contiene una o varias tablas de hechos y varias tablas de dimensiones. La tabla de hechos est\u00e1 en el centro y hay varias tablas de dimensiones asociadas a ella, que se asemejan a la forma de una estrella.  <\/p>\n\n<p><strong>Pregunta.7. \u00bfQu\u00e9 es el Esquema Snowflake?<\/strong><\/p>\n\n<p>Respuesta El esquema copo de nieve es un esquema multidimensional utilizado para modelar sistemas de almacenamiento de datos. Un esquema copo de nieve contiene una o varias tablas de hechos, m\u00faltiples tablas de dimensiones y tablas de subdimensiones. Es una prolongaci\u00f3n del dibujo de la estrella y se asemeja a la forma de un copo de nieve.<\/p>\n\n<p><strong>Pregunta.8. \u00bfQu\u00e9 es una tabla de hechos?<\/strong><\/p>\n\n<p>Respuesta: La tabla de hechos del modelo dimensional contiene informaci\u00f3n cuantitativa sobre hechos relevantes para la empresa. Las tablas de hechos se utilizan para el an\u00e1lisis y suelen estar desnormalizadas.<\/p>\n\n<p>La tabla de hechos consta de dos tipos de columnas: las columnas de \u00abclave externa\u00bb y las columnas de \u00abMedidas\u00bb. Las columnas \u00abClave externa\u00bb se utilizan para hacer referencia a las tablas de dimensiones y las columnas \u00abMedidas\u00bb contienen los datos que se van a analizar.<\/p>\n\n<p>Algunos ejemplos de hechos son el n\u00famero de productos vendidos, el n\u00famero de pedidos realizados, etc.<\/p>\n\n<p><strong>Pregunta.9. \u00bfCu\u00e1les son los tres tipos de hechos?<\/strong><\/p>\n\n<p>Contesta: Los tres tipos de hechos son:<\/p>\n\n<ul class=\"wp-block-list\">\n<li><strong>Aditivos<\/strong>: los hechos aditivos son hechos para los que se puede sumar cada dimensi\u00f3n.<\/li>\n\n\n\n<li><strong>Semiaditivos<\/strong> &#8211; Los hechos semiaditivos son hechos para los que se pueden sumar algunas dimensiones, pero no todas.<\/li>\n\n\n\n<li><strong>No aditivos<\/strong> &#8211; Los hechos no aditivos son hechos para los que no se puede sumar ninguna de las dimensiones.<\/li>\n<\/ul>\n\n<p><strong>Pregunta. 10. \u00bfQu\u00e9 es una tabla de hechos de transacci\u00f3n?<\/strong><\/p>\n\n<p>Respuesta: La tabla de hechos transaccional es uno de los tres tipos de tabla de hechos y es la m\u00e1s b\u00e1sica. En este tipo de tabla de hechos, cada suceso se almacena una sola vez y contiene los datos de nivel m\u00e1s bajo. Adem\u00e1s, el n\u00famero de filas de esta tabla de hechos es similar al n\u00famero de filas de la tabla de origen.  <\/p>\n\n<p><strong>Pregunta.11. \u00bfQu\u00e9 es una tabla peri\u00f3dica de datos instant\u00e1neos?<\/strong><\/p>\n\n<p>R: En este tipo de tabla de hechos, un hecho puede almacenarse varias veces y recoge el estado de los hechos en periodos predefinidos.<\/p>\n\n<p><strong>Pregunta.12. \u00bfQu\u00e9 es una tabla de hechos acumulativa o instant\u00e1nea acumulativa?<\/strong><\/p>\n\n<p>Respuesta: La tabla de hechos acumulados es la m\u00e1s exigente de todos los tipos de tablas de hechos y puede utilizarse cuando un proceso empresarial tiene un principio y un final definidos.  <\/p>\n\n<p><strong>Pregunta.13. \u00bfQu\u00e9 es el Grano en el contexto de una tabla de hechos?<\/strong><\/p>\n\n<p>R: \u00abGrano\u00bb en la tabla de hechos representa el nivel de detalle de una sola fila.<\/p>\n\n<p><strong>Pregunta. 14. \u00bfQu\u00e9 es una tabla de hechos sin hechos?<\/strong><\/p>\n\n<p>Respuesta: Una tabla de hechos sin hechos no contiene medidas ni hechos. Tambi\u00e9n contiene s\u00f3lo columnas de \u00abclave externa\u00bb para establecer la relaci\u00f3n entre dimensiones.<\/p>\n\n<p><strong>Pregunta.15. \u00bfQu\u00e9 es una tabla de dimensiones?<\/strong><\/p>\n\n<p>Respuesta: Una tabla de dimensiones es uno de los dos tipos de tablas que se utilizan en el modelado dimensional, el otro es una tabla de hechos. La tabla de dimensiones describe las dimensiones o criterios descriptivos de los objetos de la tabla de hechos, por ejemplo dimensi\u00f3n La ubicaci\u00f3n puede incluir calle, ciudad, c\u00f3digo postal, estado, etc.<\/p>\n\n<p><strong>Pregunta.16. Nombra algunos tipos de dimensiones.<\/strong><\/p>\n\n<p>Contesta: Son los siguientes tipos de dimensiones:<\/p>\n\n<ul class=\"wp-block-list\">\n<li>Dimensi\u00f3n que cambia lentamente<\/li>\n\n\n\n<li>Dimensi\u00f3n Conforme<\/li>\n\n\n\n<li>Dimensi\u00f3n basura\/Dimensi\u00f3n sucia<\/li>\n\n\n\n<li>Dimensi\u00f3n desagregada<\/li>\n\n\n\n<li>Dimensi\u00f3n del puente<\/li>\n<\/ul>\n\n<p><strong>Pregunta .17. \u00bfQu\u00e9 es la SCD?<\/strong><\/p>\n\n<p>R: SCD significa Cambio Lento de Dimensiones. Este es un tipo de dimensi\u00f3n. Las DSC son dimensiones cuyos atributos no cambian regularmente, sino que cambian con el tiempo.<\/p>\n\n<p>Por ejemplo: dimensi\u00f3n cliente. Los atributos de la dimensi\u00f3n cliente, como la direcci\u00f3n y el nombre del cliente, no cambian con frecuencia.  <\/p>\n\n<p><strong>Pregunta.18. \u00bfCu\u00e1les son los tipos de SCD? Explica brevemente cada una de ellas.<\/strong><\/p>\n\n<p>Respuesta: Tipos de SCD:<\/p>\n\n<ul class=\"wp-block-list\">\n<li><strong>Tipo 0<\/strong> &#8211; En este tipo los atributos de la dimensi\u00f3n nunca cambian, por ejemplo DoB- Fecha de Nacimiento.<\/li>\n\n\n\n<li><strong>Tipo 1<\/strong> &#8211; En este tipo de SCD, la nueva informaci\u00f3n sobrescribe los datos antiguos y no se hace un seguimiento de los cambios hist\u00f3ricos. Por ejemplo. cambiar el atributo \u00abCiudad\u00bb en la dimensi\u00f3n Cliente si el cliente cambia de ciudad.  <\/li>\n\n\n\n<li><strong>Tipo 2<\/strong> &#8211; En este tipo de SCD, la nueva informaci\u00f3n se a\u00f1ade a una nueva l\u00ednea y se mantiene el seguimiento de los cambios hist\u00f3ricos. Se asigna una nueva clave primaria al nuevo registro. Por ejemplo en el ejemplo anterior de cambio de ciudad, se a\u00f1ade un nuevo registro para a\u00f1adir una nueva ciudad.  <\/li>\n\n\n\n<li><strong>Tipo 3<\/strong> &#8211; En este tipo, en lugar de crear una nueva fila como en el tipo 2, se a\u00f1ade una nueva columna, por ejemplo en el ejemplo anterior de cambio de ciudad, se a\u00f1aden dos columnas m\u00e1s, \u00abNueva ciudad\u00bb y \u00abA\u00f1o\u00bb o \u00abFecha\u00bb.<\/li>\n\n\n\n<li><strong>Tipo 4<\/strong> &#8211; En este tipo de SCD, se crea una \u00abtabla hist\u00f3rica\u00bb o minidimensi\u00f3n independiente para hacer un seguimiento de los cambios. Los valores actuales de los atributos se muestran en la tabla de dimensiones, y cualquier cambio o valor antiguo se muestra en la tabla del historial.<\/li>\n\n\n\n<li><strong>Tipo 5<\/strong> &#8211; En este tipo se utiliza una minidimensi\u00f3n de tipo 4 y una referencia de tipo 1 para referenciar la tabla de minidimensiones en la tabla de dimensiones base.  <\/li>\n\n\n\n<li><strong>Tipo 6<\/strong> &#8211; En este tipo de SCD, se utiliza una combinaci\u00f3n de los tipos 1, 2 y 3. Tambi\u00e9n se conoce como m\u00e9todo \u00abh\u00edbrido\u00bb.<\/li>\n<\/ul>\n\n<p><strong>Pregunta. 19. \u00bfQu\u00e9 es la Dimensi\u00f3n Conformada?<\/strong><\/p>\n\n<p>Respuesta: Estos tipos de dimensiones pueden utilizarse en varias ubicaciones con diferentes tablas de hechos, ya sea en una \u00fanica base de datos o en varios data marts.<\/p>\n\n<p>Algunos ejemplos de dimensiones conformes son la dimensi\u00f3n cliente, la dimensi\u00f3n producto, la dimensi\u00f3n tiempo, etc. Por ejemplo La dimensi\u00f3n producto puede utilizarse para calcular el n\u00famero de productos vendidos y los ingresos generados.<\/p>\n\n<p><strong>Pregunta 20. \u00bfQu\u00e9 es la Dimensi\u00f3n Basura o Dimensi\u00f3n Sucia?<\/strong><\/p>\n\n<p>Respuesta: Como su nombre indica, estas dimensiones contienen atributos basura o aleatorios que no pertenecen a ninguna dimensi\u00f3n concreta. Estas dimensiones se crean para evitar muchas claves externas en la tabla de hechos.<\/p>\n\n<p><strong>Pregunta. 21. \u00bfQu\u00e9 es la Dimensi\u00f3n Degenerada?<\/strong><\/p>\n\n<p>Respuesta Una dimensi\u00f3n degenerada es una dimensi\u00f3n que no tiene su propia dimensi\u00f3n independiente, sino que forma parte de una tabla de hechos, por ejemplo. el n\u00famero de recibo o factura no tiene una tabla de dimensiones separada. Sin embargo, como es muy importante desde el punto de vista empresarial, se almacena en una tabla de hechos.<\/p>\n\n<p><strong>Pregunta.22. \u00bfQu\u00e9 es Data Mart?<\/strong><\/p>\n\n<p>R: Un mercado de datos es una base de datos que contiene datos almacenados en uno de los segmentos de un almac\u00e9n de datos, por lo que, en otras palabras, un mercado de datos es un subconjunto de un almac\u00e9n de datos. Estos segmentos del almac\u00e9n de datos suelen pertenecer a \u00e1reas empresariales organizativas individuales, como finanzas, marketing, ventas, etc.  <\/p>\n\n<p><strong>Pregunta. 23. \u00bfQu\u00e9 es un diagrama BUS?<\/strong><\/p>\n\n<p>Contesta: El esquema BUS contiene dimensiones conformes. En otras palabras, se utiliza para identificar las dimensiones comunes a todos los almacenes de datos de una organizaci\u00f3n.  <\/p>\n\n<p><strong>Pregunta. 24. \u00bfCu\u00e1les son las tres capas del ciclo ETL? Expl\u00edcalos brevemente.<\/strong><\/p>\n\n<p>Respuesta: Las tres capas del ciclo ETL son.<\/p>\n\n<ul class=\"wp-block-list\">\n<li><strong>Capa de puesta en escena<\/strong>: tambi\u00e9n se conoce como capa de origen. Esta capa se utiliza para almacenar datos recogidos de distintas fuentes de datos.  <\/li>\n\n\n\n<li><strong>Capa<\/strong> de integraci\u00f3n &#8211; Una vez transformados los datos de origen, se almacenan en la capa de integraci\u00f3n. En esta capa, los datos se almacenan en una base de datos.<\/li>\n\n\n\n<li><strong>Capa de acceso<\/strong>: tambi\u00e9n conocida como capa de dimensi\u00f3n. Es la capa frontal que utiliza el usuario final para generar informes.<\/li>\n<\/ul>\n\n<p><strong>Pregunta. 25. \u00bfQu\u00e9 es una zona de parada?<\/strong><\/p>\n\n<p>R: Un \u00e1rea de preparaci\u00f3n tambi\u00e9n se conoce como zona de \u00abaterrizaje\u00bb, donde se almacenan temporalmente datos de diversas fuentes. El \u00e1rea de preparaci\u00f3n es importante porque todos los datos deben estar disponibles en un \u00e1rea antes de cargarlos en el almac\u00e9n de datos o en el mercado de datos. Se utiliza para almacenar y limpiar los datos antes de trasladarlos a la base de datos de destino.<\/p>\n\n<p><strong>Pregunta. 26. \u00bfQu\u00e9 es el SAD?<\/strong><\/p>\n\n<p>R: ODS significa Almac\u00e9n de Datos Operativos. Se utiliza para elaborar informes operativos de datos almacenados en distintos almacenes de datos. Tambi\u00e9n incluye una instant\u00e1nea de los datos m\u00e1s recientes de estas fuentes.<\/p>\n\n<p><strong>Pregunta.27. \u00bfQu\u00e9 son las transformaciones activas y pasivas? Expl\u00edcalos brevemente.<\/strong><\/p>\n\n<p>Contesta:  <\/p>\n\n<ul class=\"wp-block-list\">\n<li>Transformaci\u00f3n activa &#8211; En este tipo de transformaci\u00f3n, el n\u00famero de filas se modifica cuando los datos se transfieren de la base de datos de origen a la de destino.<\/li>\n\n\n\n<li>Transformaci\u00f3n pasiva &#8211; En este tipo de transformaci\u00f3n, el n\u00famero de filas no cambia cuando los datos se transfieren a la base de datos de destino.  <\/li>\n<\/ul>\n\n<p><strong>Pregunta. 28. \u00bfQu\u00e9 es la limpieza de datos?<\/strong><\/p>\n\n<p>R: La limpieza de datos es el proceso de eliminar o suprimir datos no deseados de un almac\u00e9n de datos. Suele hacerse para liberar espacio en la base de datos.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Las pruebas ETL se utilizan para verificar la correcci\u00f3n de la migraci\u00f3n de datos de la base de datos de origen a la base de datos de destino, junto con la verificaci\u00f3n de las reglas de transformaci\u00f3n.<\/p>\n","protected":false},"author":8,"featured_media":1782,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[33],"tags":[],"class_list":["post-1781","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-preguntas-de-la-entrevista"],"acf":[],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/posts\/1781","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/comments?post=1781"}],"version-history":[{"count":1,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/posts\/1781\/revisions"}],"predecessor-version":[{"id":1783,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/posts\/1781\/revisions\/1783"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/media\/1782"}],"wp:attachment":[{"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/media?parent=1781"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/categories?post=1781"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ittester.sk\/es\/wp-json\/wp\/v2\/tags?post=1781"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}